Você está na página 1de 180

MATERIAL DIDTICO

Estatstica Experimental Medicina Veterinria

Faculadade de Cincias Agrrias e Veterinrias

Campus de Jaboticabal SP

Gener Tadeu Pereira

2 SEMESTRE DE 2014
NDICE

INTRODUO AO R ................................................................................................ 2
AULA 1 ESTATSTICA DESCRITIVA ......................................................................... 3
1 EXERCCIO PRTICO ESTATSTICA EXPERIMENTAL ................................................... 23
AULA 2 TESTES DE SIGNIFICNCIA ..................................................................... 25
2 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL ............................................. 35
AULA 3- DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) .................................. 37
3 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL ............................................. 58
AULA 4 TESTE DE COMPARAES MLTIPLAS ....................................................... 61
4 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL ............................................. 79
AULA 5 TESTES F PLANEJADOS ............................................................................ 80
5 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL ............................................. 89
AULA 6 DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC) .................................... 91
6 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL ........................................... 106
AULA 7 DELINEAMENTO QUADRADO LATINO (DQL). .............................................. 109
7 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL ........................................... 124
AULA 8 EXPERIMENTOS FATORIAIS ..................................................................... 126
8 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL ........................................... 138
AULA 9 EXPERIMENTOS FATORIAIS: ANALISANDO UM FATORIAL A X B ................... 143
9 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL ........................................... 155
AULA 10 EXPERIMENTOS EM PARCELA SUBDIVIDIDA ........................................... 157
10 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL ......................................... 169
AULA 11 EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS - ANLISE DE MEDIDAS
REPETIDAS NO TEMPO. ...................................................................................... 171
AULA 12 TRANSFORMAO DE DADOS ................................................................ 175
2

Introduo ao R

1 O que o R?

R uma linguagem e ambiente para calcular estatsticas e grficos. Ele


um projeto GNU o qual similar linguagem S e ambiente a qual foi
desenvolvida na Bell Laboratories , formalmente (AT&T) por John Chambers
e colaboradores. R pode ser considerado uma implantao diferente do S.
Existem algumas diferenas importantes, mas muitos dos cdigos escritos para
o S rodam sem modificaes no R.
O R fornece uma grande variedade de tcnicas estatsticas (modelagem
linear e no linear, testes estatsticos clssicos, anlise de sries-temporais, ...)
e grficas, e altamente extensvel.
Um dos pontos fortes de R a facilidade com que bem projetados
grficos para publicaes de qualidade pode ser produzidos, incluindo
smbolos matemticos e frmulas.
R esta disponvel como um programa livre (Free Software) sob os
termos da Free Software Foundations GNU General Public License.

2 Instalando o R

Geralmente, o sistema R consite de duas partes. Uma denominada de


Sistema bsico do R para o ncleo da linguagem R e bibliotecas fundamentais
associadas. A outra consiste de contribies de usurios que desenvolvem
pacotes que so aplicaes mais especializadas. Ambas as partes podem
obtidas do Comprehensive R Archive Network (CRAN) do site:

http://CRAN.r-project.org

A instalao do sistema R descrito a seguir

2.1 Instalando o Sistema bsico do R

Usurios do Windows podem baixar a ltima verso do R no endereo

http://www.vps.fmvz.usp.br/CRAN/

Em Dowload and Install R, acione o link que corresponde ao sistema


operacional do seu computador ( no caso do Windows Dowload R for
Windows e depois no link base. Depois de baixar (salvar) o arquivo
executvel, basta execut-lo e seguir a rotina de instalao. Neste mesmo
endereo so disponibilizadas verses do R nas plataformas do Linux ,e
MacOS X.
O endereo acima o local disponvel mais prximo de Jaboticabal, no
caso a USP/Pirassununga, SP.

Estatstica Experimental
3

Aula 1 Estatstica Descritiva

1 Smbolos: conjunto de dados e da somatria

Conjunto de dados:
Considere uma varivel aleatria de interesse representada pela letra
maiscula Y e os valores especficos assumidos por esta varivel aleatria
pelas letras minsculas y. Para distinguir um valor do outro, utilizamos um
subscrito i. Por exemplo, y 1 , y 2 , ... , y n . Em geral, um valor tpico da varivel
aleatria ser designado por yi e o valor final desta amostra por yn, sendo que
n representa o tamanho da amostra.
Uma notao compacta para representar a soma de todos os valores de
uma varivel aleatria de interesse, por exemplo, Y,
n


i
yi
1
y 1 y 2 ... y n

A letra grega (sigma) usada como smbolo da soma para a soma e yi


para o valor da observao i, denominado de sinal de soma, ser usado
extensivamente neste curso.
Alguns exemplos e propriedades da somatria:

A soma de n nmeros y 1 , y 2 , ... , y n , como vimos, pode ser expressa por


n


i
yi
1
y 1 y 2 ... y n

A soma dos quadrados de n nmeros y1 , y 2 , ... , y n :


n


i
yi
1
2
y i2 y 22 ... y n2

A soma dos produtos de dois conjuntos de n nmeros x1 , x2 , ... , xn


e y1 , y 2 , ... , y n :
n


i
xi yi x y
1
1 1 x 2 y 2 ... x n y n

Exemplo: Considere um conjunto de 3 nmeros: 1, 3 e 6. Os nmeros


so simbolizados por: Y y 1 , y 2, y 3 1, 3, 6
A soma e a soma dos quadrados destes nmeros so:
n n

y i 1 3 6 10 ,
i 1

i
yi
1
2
12 32 62 46

Considere outro conjunto de nmeros x 1 2, x 2 4 e x 3 5.


A soma dos produtos de x e y :
3


i
1
xi yi (2 )(1)
(4 )(3 )
(5 )(6 )
44

As trs principais regras da adio so:

1 A soma da adio de dois conjuntos de nmeros igual adio das


somas
n n n

(x i y i ) x i y i
i 1 i 1 i 1

Estatstica Experimental
4

2 A soma dos produtos de uma constante k e uma varivel Y igual ao


produto da constante pela soma dos valores da varivel (yi)
n n

k y i k y i
i 1 i 1
3 A soma de n constantes com valor k igual ao produto n k
n


i
k k k ... k
1
n k
n
Ateno: notem que o clculo da expresso
i
1
yi 2
y 12 y 22 ... y n2 ,

denominada de soma de quadrados diferente do clculo da expresso


n
( y i )
2
(y 1 y 2 ... y n )
2
, denominada de quadrado da soma.
i 1
Outras notaes:
n

n
y yi
y+ =
i
1
yi y 1 y 2 ... y n , e y
n
i
1
n
Notao com dois subescritos. Considere dois grupos de dados

1. grupo controle: { 5, 7, 5, 4 } , o qual representado por


y 11 5, y 12 7, y 13 5, y 14 4 ,
2. grupo tratado: { 7 , 9 , 6 , 9 , 8 } , o qual representado por
y 21 7, y 22 9, y 23 6, y 24 9, y 25 8 ,
sendo, i =1, 2, representando os grupos e j = 1, 2,..., ri
representando as repeties dentro de cada grupo.
2 ri

( y ij )
i 1
2

j 1
Calcular o valor da expresso
ri
Exemplo de Tabela de dupla entrada. Qualquer observao
representada por yij , sendo que, o ndice i refere-se s linhas (i=1, 2,..., k) e o
ndice j refere-se s colunas (j=1, 2, ..., r).
Colunas
Linhas 1 2 3 ... j ... r Total Mdia
1 y11 y12 y13 ... ... ... y1r y1+ y 1
2 y21 y22 y23 ... ... ... y2r y2+ y 2
3 y31 y32 y33 ... ... ... y3r y3+ y 3
. . . . . ... . . . .
. . . . . ... . . . .
. . . . . ... . . . .
i . . . . yij . . yj+ yj
. . . . . . . . .
. . . . . . . . . .
.
. . . . . . . . .
.
k yk1 yk2 yk3 ... ... ... ykr yk+ yk
Total y+1 Y+2 y+3 ... y+j ... y+r y++
Mdia y 1 y 2 y 3 ... yj ... y r y

Estatstica Experimental
5

y j o total da j sima coluna; y j a mdia da j sima coluna;


y i o total da i sima linha; y i a mdia da i sima linha;
y o total geral (soma de todas as observaes ); y a mdia geral

2 Medidas de tendncia central


Um dos aspectos mais importantes do estudo de um conjunto de dados
a posio do valor central. Qualquer valor numrico que representa o centro
de um conjunto de dados denominado de medida de locao ou medida de
tendncia central. As duas medidas mais comumente utilizadas mdia
aritmtica, ou simplesmente a mdia, e a mediana.

2.1 Mdia aritmtica.


A mais familiar medida de tendncia central a mdia aritmtica. Ela
a medida descritiva que a maioria das pessoas tem em mente quando elas
falam de mdia.
A mdia pode ser expressa como
n

yi
y 1 y 2 ... y n y
y i
1

n n n
Vamos supor que a varivel aleatria Y assume os seguintes valores,
{ 10, 54, 21, 33, 53 }, ento a mdia destes 5 valores dada por:
5

yi
10 54 21 33 53 171
y i
1
34,2
5 5 5
Script no R para o clculo da mdia
# calculo da mdia pela definio
y <-c(10,54,21,33,53)
media.1<-sum(y)/length(y)

# pela funo mean( )


media.2<-mean(y)
Propriedades da mdia;
a) nica. Para um conjunto de dados existe uma e somente uma mdia
aritmtica.
b) Simplicidade. A mdia aritmtica fcil de ser entendida e fcil de ser
calculada.
c) Dado que toda observao do conjunto de dados entra no seu
clculo, ela afetada por cada valor. Valores extremos tm influncia na mdia
e, em algumas situaes podem ocorrer distores, o que pode torn-la uma
medida indesejvel como medida de tendncia central.

2.2 Mediana.
Uma alternativa mdia aritmtica como medida de tendncia central
a mediana. A mediana de um conjunto de valores finitos o valor que ocupa
a posio central dos dados ordenados, ou seja, aquele valor o qual divide o
conjunto de dados em duas partes iguais tal que o nmero de valores iguais ou

Estatstica Experimental
6

maiores que a mediana igual ao nmero de valores menores ou iguais que a


mediana. Temos que considerar duas situaes:

y(k 1) se n 2k 1(n impar )


~
y 1
2(y(k ) y(k 1))
se n 2k (n par )

Exemplos:
1. Considere os dados 10, 54, 21, 33, 53 , com n=5 observaes, e a
seqncia ordenada fica 10, 21, 33, 53, 54. A mediana calculada como sendo
a observao que ocupa a 3 posio da seqncia ordenada, ou seja,
/ 2, ou seja, k 2 y~ y(21) y(3 ) 33
n 2k 1 k (n 1)
2. Considere os dados 10, 54, 21, 33, 53, 55, e a seqncia ordenada
fica 10, 21, 33, 53, 54, 55. Como o nmero de observaes par e a mediana
calculada como sendo a mdia das observaes que ocupam a posio
central, ou seja,
1 1
n 2k k (n ) / 2, ou seja, k 3 y~ (y(3 ) y(3 1))
(y(3 ) y(4 ))
2 2
1
(33 53 ) 43
2
Script no R para o clculo da mediana

# calculo da mediana pela funo median( )


mediana<-median(y)

Propriedades da mediana;
a) nica. Assim como a mdia, para um conjunto de dados existe
uma e somente uma mediana.
b) Simplicidade. A mediana fcil de ser calculada.
c) Ela no drasticamente afetada por valores extremos, como a
mdia.

2.3 Moda.
A moda comumente definida como a observao mais freqente
do conjunto de dados. Se todas as observaes so diferentes no existe
moda; por outro lado um conjunto de dados pode ter mais de uma moda.
Exemplo: considere o conjunto de dados
{98, 102, 100, 100, 99, 97, 96, 95, 99, 100}, ento a moda mo =
100, e no conjunto de dados, abaixo,
{ 20, 21, 20, 20, 34, 22, 24, 27, 27, 27} existe duas modas 20 e 27
(bimodal).

Estatstica Experimental
7

a) b)

c) d)

Figura 1.1 Distribuies de freqncia mostrando as medidas de


tendncia central. Distribuies em a) e b) so simtricas, c)
positivamente assimtrica, e d) negativamente assimtrica. As
distribuies a), c), e d) so unimodal, e a distribuio b) bimodal.

3 Medidas de disperso
Apesar das medidas de tendncia central fornecerem uma idia do
comportamento de um conjunto de dados, elas podem esconder valiosas
informaes. Essas medidas no so suficientes para descrever ou discriminar
diferentes conjunto de dados. Por exemplo, a Figura 3.1 mostra os polgonos
de freqncia duas variveis que possuem a mesma mdia, mas diferentes
valores de disperso. A varivel B, a qual tem maior variabilidade que a
varivel A, mais espalhada. A disperso de um conjunto de dados se refere
variedade que eles exibem. Uma medida de disperso fornece informao a
respeito da quantidade de variabilidade presente no conjunto de dados.

Figura 3.1 Dois polgonos de freqncia com a mesma mdia, mas com
diferentes quantidades de disperso.
Se todos os valores do conjunto de dados so iguais, no existe
disperso; se eles so diferentes, a disperso est presente nos dados. A
quantidade de disperso pode ser pequena, quando os dados, embora
diferentes, so muito prximos.

3.1 Amplitude
A amplitude definida como a diferena entre o maior e o menor valor
do conjunto de dados. O problema desta mediada que ela s leva em conta
dois valores do conjunto de dados e, assim, seria mais conveniente
considerarmos uma mediada que utilizasse todas as observaes do conjunto
de dados. A primeira idia que ocorre considerar o desvio de cada

Estatstica Experimental
8

observao em relao a um ponto de referncia e ento calcular a sua mdia.


Se tomarmos a mdia aritmtica como este ponto de referncia, temos a
seguinte situao:
Seja o conjunto de dados y 1, y 2,..., y n e y , a mdia destes dados.
Definiremos por d i y i y , os desvios destas observaes em relao sua
mdia. Por exemplo, considere os dados y 1 4, y 2 5, y 3 6 e y 4 9 . Assim
temos:
4569
y 6,
4
d 1 (4 6 ) 2, d 2 (5 6 )
1,d 3 (6 6 )
0, d 4 (9 6 )
3
4
Reparem que a soma dos desvios igual a zero, ou seja, d
i 1
i 0 . Isto

pode ser provado algebricamente, da seguinte forma,


n

n n n n n n yi n n


i
d i (y i
1 i 1
y i y y i ny y i n
y)
i 1 i 1 i 1 n i 1 i 1
i 1
i1
yi yi 0

Portanto a soma destes desvios no seria nada informativa sobre a


disperso dos dados. Definiremos ento, uma medida que utiliza o quadrado
dos desvios em relao mdia.

3.2 Varincia e desvio-padro


A varincia de um conjunto de dados, definida como mdia dos
desvios das observaes em relao mdia ao quadrado, ou seja,
(y y )2
(y 2 y )
2
... (y n y )
2
s2 1
n 1
Para manter a mesma unidade dos dados originais, conveniente
definirmos o desvio-padro como sendo a raiz quadrada positiva da varincia
s2,
(y 1 y )
2
(y 2 y )
2
. yn y )
..( 2
s
n 1

A varincia amostral frequentemente calculada usando-se a


frmula mais rpida e prtica
2 (y 1 y 2 ... y n )
2
1 2
s2 y 1 y 2 ... y n
2

n 1 n
n
2

1 n
( yi )
y i
2 i 1

n 1 i 1 n

Exemplo: Os pesos (em pounds) de uma amostra aleatria de trutas em
um lago so:
1,19; 0,93; 2,40; 1,71; 0,89; 1,74; 1,06; 1,16; 1,47; 1,15

A mdia aritmtica destes dados


1 13,7
y (1,19 0,93 ... 1,15 ) 1,37 pounds .
10 10
E a varincia

Estatstica Experimental
9

1
s2 ( 1,19 1,37 )2 (0,93 1,37 )2 ... (1,15 1,37 )2
10 1
0,2187(pounds ) 2

Alternativamente, temos
2
1 2 ( 1,19 0,93 ... 1,15 )
s2 2 2
1,19 0,93 ... 1,15
10 1 10
1 13,70
0,2187(pounds ),e
2
20,74
9 10
s 0,2187 0,47 pounds.
Script no R para os clculos acima
# entrando com os dados pelo comando concaternar c( )
peso <- c(1.19, 0.93, 2.40, 1.71, 0.89, 1.74, 1.06, 1.16, 1.47, 1.15)

# clculo da mdia pela definio com os comandos sum() e length()


m.peso1 <- sum(peso)/length(peso)
m.peso1

# clculo da mdia pela funo mean()


m.peso2 <- mean(peso)
m.peso2

#
# para saber mais detalhes da funo mean() execute o comando ??mean()
#

# 3 formas de se calcular a varincia pelas frmulas do item 3.4


v1.peso <- sum((peso-mean(peso))^2)/(length(peso)-1)
v1.peso

v2.peso <- (sum(peso^2)-sum(peso)^2/length(peso))/(length(peso)-1)


v2.peso

# clculo pela funo var( )


v3.peso <- var(peso)
v3.peso

# clculo do desvio padro pela definio


sd1.peso <- sqrt(v3.peso)
sd1.peso

# clculo do desvio padro pela funo sd( )


sd2.peso <- sd(peso)
sd2.peso

3.3 Quartis
Alguns quartis so definidos de modo anlogo mediana. Assim como a
mediana divide o conjunto de dados em duas partes, os quartis dividem os
dados em quatro partes. O segundo quartil, representado por Q2 igual

Estatstica Experimental
10

mediana, ento Q2 y ~ . O primeiro quartil, Q definido como aquele valor do


1
conjunto de dados tal que no mais que 25% dos dados tm valores menores
que Q1 e no mais que 75% dos dados tm valor maior que Q1. O terceiro
quartil, Q3, pode ser definido de maneira similar. Assim como a mediana, mais
de uma observao pode satisfazer a definio dos quartis. As seguintes
frmulas podem ser utilizadas para calcular o primeiro e o terceiro quartis de
um conjunto de dados
n 1
Q1 sima observao ordenada
4
3(n 1)
Q3 sima observao ordenada
4
3.4 Grfico BOX-PLOT
O grfico tipo Box-plot um recurso visual til de comunicao da
informao contida em conjunto de dados. O objetivo de um grfico tipo Box-
Plot mostrar as principais caractersticas de um conjunto de dados. Para
interpretar um grfico Box-Plot adequadamente, os valores devem ser
visualizados como pontos de linha horizontal/vertical localizada no centro do
grfico. Valores grandes correspondem a grandes pontos na horizontal/vertical.
Existem trs componentes importantes no grfico Box-plot:
A caixa, a qual contm 50% dos valores, comea no primeiro quartil
Q1 e termina no terceiro quartil, Q3.
As duas pontas (whiskers), se extendem acima e abaixo da caixa
at a localizao da maior e da menor observao que esto
dentro da distncia de 1.5 vezes o intervalo interquartil.
Os valores atpicos outliers, so os valores fora das pontas.

Exemplo: Considere os dados a seguir, os quais se referem a peso (g)


de tumores cancergenos extrados do abdome de 57 ces

68 63 42 27 30 36 28 32 79 27 22 23 24 25 44 65 43 25 74
51 36 42 28 31 28 25 45 12 57 51 12 32 49 38 42 27 31 50
38 21 16 24 69 47 23 22 43 27 49 28 23 19 46 30 43 49 12

O conjunto ordenado fica:

12 12 12 16 19 21 22 22 23 23 23 24 24 25 25 25 27 27 27
27 28 28 28 28 30 30 31 31 32 32 36 36 38 38 42 42 42 43
43 43 44 45 46 47 49 49 49 50 51 51 57 63 65 68 69 74 79
Assim, a menor e a maior observao 12 e 79, respectivamente. O
nmero de observaes 57. O primeiro quartil a observao

57 1
Q1 14.5 y(14,5 ) 25 g,
4
e o terceiro quartil

3(57 1)
Q3 43.5 y(43,5 ) 46,5 g
4

Script no R para os clculos acima

Estatstica Experimental
11

# entrando com os dados


p.tumor <- c(68, 63, 42, 27, 30, 36, 28, 32, 79, 27,
22, 23, 24, 25, 44, 65, 43, 25, 74, 51,
36, 42, 28, 31, 28, 25, 45, 12, 57, 51,
12, 32, 49, 38, 42, 27, 31, 50, 38, 21,
16, 24, 69, 47, 23, 22, 43, 27, 49, 28,
23, 19, 46, 30, 43, 49, 12)

# observao mnima dos dados do vetor p.tumor pela funo min()


min.ptumor <- min(p.tumor)
min.ptumor

# observao mxima dos dados do vetor p.tumor pela funo max()


max.ptumor <- max(p.tumor)
max.ptumor

# clculo da amplitude pela definio


amplitude<-max.ptumor-min.ptumor
amplitude

# clculo do quantil 0.20 com a funo quantile()


q.20 <- quantile(p.tumor,0.20)
q.20

# clculo do primeiro quartil Q1


q1 <- quantile(p.tumor,0.25)
q1

# clculo do primeiro quartil Q2


q2 <- quantile(p.tumor,0.50)
q2

# clculo do terceiro quartil Q3


q3<- quantile(p.tumor,0.75)
q3

# calculo da mediana
mediana<- median(p.tumor)
mediana

# reparem que a mediana igual ao segundo quartil

# clculo dos 3 quartis (0.25, 0.50, 0.75) de uma nica vez


quartis <- c(0.25,0.50,0.75)
quantile(p.tumor,quartis)

# apresentando a funo summary( )


summary(p.tumor)

# 2 grficos pela funo boxplot()


boxplot(p.tumor) # grfico default

Estatstica Experimental
12

# incrementando o grfico
boxplot(p.tumor,
col=2, # colocando cor no grfico
horizontal= T, # na posio horizontal
main= "Grfico Box-Plot") # colocando ttulo principal
Grfico produzido pela ltima funo boxplot( )

O exame deste Grfico revela que 50% das observaes esto no


retngulo entre os valores do Q1=25 e Q3=46,5. A linha vertical dentro da caixa
representa o valor da mediana, Q2, a qual 32. A longa cauda a direita do
grfico indica que a distribuio de peso de tumores levemente assimtrica
direita. O smbolo da bolinha indica que existe uma observao atpica neste
conjunto de dados, observao cujo valor 79, com uma probabilidade de
ocorrncia muito baixa.

3.5 Medidas da forma da distribuio


As medidas da forma de uma distribuio so os coeficientes de
assimetria (skewness) e curtosis (kurtosis).
Assimetria uma medida da assimetria da distribuio de freqncia.
Ela mostra se os desvios da mdia so maiores de um lado do que do outro
lado da distribuio. Ela dada por
3
n n
yi y
ass
(n 1)(n 2 )i 1 s

Para uma distribuio simtrica o coeficiente de assimetria zero. Ela
positiva quando a cauda da direita mais alongada e negativa quando a cauda
da esquerda mais alongada.

a) b)

Figura 3.3 Ilustraes da assimetria a) negativa e b) positiva


Curtosis uma medida da forma das caudas de uma distribuio. Ela
dada por

Estatstica Experimental
13

4
n(n 1) n
yi y 3(n 1)2
ct
(n 1)(n 2 )(n 3 )i 1 s (n 2 )(n 3 )
Para variveis, tais como, peso, altura ou produo de leite, espera-se
que a distribuio de freqncia seja simtrica em torno da mdia e tenha a
forma de um sino. Estas so as distribuies normais. Se as observaes tm
distribuio normal ento a curtosis igual a zero (ct = 0). Uma distribuio
com curtosis positiva tem uma grande freqncia de observaes prximas da
mdia e caudas finas. Uma distribuio com curtosis negativa tem as caudas
mais grossas e uma baixa freqncia de dados perto da mdia.
Script no R para os clculos dos coeficientes de assimetria e curtosis

# definindo uma funo para o clculo do coef. de assimetria


ass<-function(x){ # incio da funo
m3<-sum((x-mean(x))^3)
s3<-sd(x)^3
n <- length(x);n_1 <- length(x)-1; n_2 <- length(x)-2
coef<- n/(n_1*n_2)
coef*m3/s3 } # trmino da funo

# aplicando a funo ass( ) aos dados de p.tumor


ass(p.tumor)

# definindo uma funo para o clculo do coef. de curtosis


ct <-function(x) { # inicio da funo
m4<-sum((x-mean(x))^4)
s4<-sd(x)^4
n<-length(x);coef1<-n*(n+1)/((n-1)*(n-2)*(n-3));coef2<- 3*(n-1)^2/((n-2)*(n-3))
coef1*m4/s4 - coef2} # trmino da funo
# aplicando a funo aos dados de p.tumor
ct(p.tumor)

# definindo uma funo ed( ) que calcula todas as estatsticas descritivas


ed<-function (x) { # inicio da funao
media<-mean(x) # clculo da mdia
dp<-sd(x) # clculo do desvio padro
minimo<-min(x) # clculo do mnimo
maximo<-max(x) # clculo do mximo
q1<-quantile(x,0.25) # clculo do 1 quartil
mediana<-median(x) # clculo da mediana q2
q3<-quantile(x,0.75) # clculo do terceiro quartil
cv<-sd(x)/mean(x)*100 # clculo do coef. variao

# clculo do coef. de assimetria


m3<-sum((x-mean(x))^3)
s3<-sd(x)^3
n <- length(x)
coef<- n/((n-1)*(n-2))
ass<-coef*m3/s3

# clculo do coef. curtosis

Estatstica Experimental
14

m4<-sum((x-mean(x))^4)
s4<-sd(x)^4
n<-length(x)
coef1<-n*(n+1)/((n-1)*(n-2)*(n-3))
coef2<- 3*(n-1)^2/((n-2)*(n-3))
ct<-coef1*m4/s4 - coef2

# definindo a sada
c(mnimo=minimo,Q1=q1,mdia=media,mediana=mediana,desv_pad=dp,
Q3=q3,mximo=maximo,CV=cv,Assimetria=ass,Curtosis=ct)
} # final da funo ed( )

# aplicando a funo ed( ) aos dados de p.tumor


round(ed(p.tumor),1) # a funo round( ) controla as casas decimais
Abaixo esto estas estatsticas calculadas pelo script acima

mnimo Q1.25% mediana desv_pad Q3.75% mximo CV


12.0 25.0 32.0 15.9 46.0 79.0 43.2
Assimetria Curtosis
0.8 0.1

3.6 Histograma
O grfico do histograma outro recurso visual muito usado para a
anlise da forma da distribuio. No script do R abaixo so apresentados
alguns exemplos doa funo hist( ) e sua correspondncia com o grfico Box-
Plot.

# histograma dos dados p.tumor


hist(p.tumor) # default

# histograma com mais opes


hist(p.tumor,
col="light blue", # colocando a cor azul
xlab=" Classes de Peso (g)", # ttulo do eixo x
ylab="Frequncia", # ttulo do eixo y
nclass=8, # nmero de colunas
border="dark blue") #colocando bordas no grfico

Sada fornecida pelo script acima


Histograma
20
15
Frequncia

10
5
0

10 20 30 40 50 60 70 80

Classes de Peso (g)

Apresentao do histograma e do Box-Plot juntos


# dividindo a janela grfica em 2 linhas e 1 coluna
par(mfrow=c(2,1))

Estatstica Experimental
15

# histograma
hist(p.tumor,
col="light blue", # colocando a cor azul
xlab=" Classes de Peso (g)", # ttulo do eixo x
ylab="Frequncia", # ttulo do eixo y
nclass=8, # nmero de colunas
border="dark blue", # colocando bordas no grfico
main="Histograma") # ttulo principal

# grfico box plot


boxplot(p.tumor,
col=2, # colocando cor no grfico
horizontal= T, # na posio horizontal
main= "Grfico Box-Plot") # colocando ttulo principal
Histograma
Frequncia

15
0 5

10 20 30 40 50 60 70 80

Classes de Peso (g)

Grfico Box-Plot

10 20 30 40 50 60 70 80

Grficos para dados com uma classificao uma ferramenta muito til
na nalise exploratria de dados. Considere a questo n 1 da 1 Lista de
exerccios, apresentada ao final da Aula 1. Nesta questo solicitado a
construo do grfico de barras para cada tipo de comida. O script no R para
construir estes grficos :

# entrando com todas as observaes


n.moscas<-c(15,20,31,16,22,22,23,33,38,28,25,20,21,23,29,26,40,20,19,31,
6,19,0,2,11,12,13,12,5,16,2,7,13,20,18,19,19,9,9,9)

# definindo um vetor para cada tipo de comida


t.comida <- c(rep("c.regular",20),rep("c.suco",20))
#calculando a mdia para cada tipo de comida com o comando tapply()
m.moscas<-tapply(n.moscas,t.comida,mean)

#calculando o desvio-padro para cada tipo de comida com o comando tapply()


sd.moscas<-tapply(n.moscas,t.comida,sd)

# grfico de barras do valor mdio de cada tipo de comida


bar.moscas<-barplot(m.moscas, cex.names=0.7,
xlab="Comida",col=c(2,3),
ylab="Comprimento mdio (sd)",
ylim=c(0,max(mean(m.moscas)+sd(m.moscas)*2)))

# colocando os eixos do desvio-padro no grfico de barras

Estatstica Experimental
16

arrows(bar.moscas,m.moscas-sd.moscas,
bar.moscas,m.moscas+sd.moscas, length=0.1, angle=90, code=3)

# grfico Box-plot para cada tipo de comida


boxplot(n.moscas~t.comida,col=c(2,3))

3.7 Coeficiente de variao (CV)


O desvio-padro til como medida de variao dentro de um conjunto
de dados. Quando desejamos comparar a disperso de dois conjuntos de
dados, a comparao dos desvios-padres dos dois conjuntos de dados pode
nos levar a concluses falsas. Pode acontecer que as duas variveis
envolvidas esto medidas em unidades diferentes. Por exemplo, podemos
estar interessados em saber se os nveis do soro de colesterol, medido em
miligramas por 100 ml so mais variveis do que o peso corporal, medido em
kilograma.
O que necessrio nesta situao o uso de uma medida de variao
relativa do que uma medida absoluta. Tal medida o COEFICIENTE DE
VARIAO (CV), a qual expressa o desvio padro como uma porcentagem da
mdia, e sua frmula
s
cv (100 )% ,
y
a qual uma medida independente da unidade.
Exemplo: considere os valores abaixo de mdia e desvio-padro de dois
grupo de ces, identificados pelas suas idades
Amostra 1 Amostra 2
Grupo 10 anos 4 anos
Peso mdio 145 80
Desvio-padro 10 10
Uma comparao dos seus respectivos desvios-padres leva a uma
concluso de que as duas amostras tm a mesma variabilidade. Se
calcularmos os coeficientes de variao, para o grupo 1
10
cv (100 ) 6 ,9%
145
e para o grupo 2,
10
cv (100 ) 12 ,5% ,
80
e comparando estes resultados temos uma impresso bem diferente. O grupo
2 tem uma variabilidade de 1,8 vezes maior em relao ao grupo 1. O
coeficiente de variao muito til na comparao de resultados obtidos por
diferentes pesquisadores que investigam a mesma varivel. Visto que o
coeficiente de variao independente da unidade, ele til para comparar a
variabilidade de duas ou mais variveis medidas em diferentes unidades.
# definindo uma funo para o clculo do coeficiente de variao
cv <- function(x) sd(x)/mean(x)*100

# aplicando a funo aos dados de p.tumor


cv(p.tumor)

4.ESTATSTICA EXPERIMENTAL

Estatstica Experimental
17

4.1 INTRODUO
Numa pesquisa cientfica o procedimento geral formular hipteses e
verific-las diretamente ou por suas conseqncias. Para isto necessrio um
conjunto de observaes e o planejamento de experimentos ento essencial
para indicar o esquema sob o qual as hipteses possam ser verificadas com a
utilizao de mtodos de anlise estatstica que dependem da maneira sob a
qual as observaes foram obtidas. Portanto, planejamento de experimentos e
anlises dos resultados esto intimamente ligados e devem ser utilizados em
uma seqncia nas pesquisas cientficas das diversas reas do conhecimento.
Isto pode ser visto por meio da seguinte representao grfica da circularidade
do mtodo cientfico.
(2)
Observaes
(1) (3)
Formulao de Hipteses Verificao das Hipteses formuladas

(4)
Desenvolvimento da Teoria
Fica evidente nesta ilustrao que as tcnicas de planejamento devem
ser utilizadas entre as etapas (1) e (2) e os mtodos de anlise estatstica
devem ser utilizados na etapa (3).
Desenvolvendo um pouco mais est idia podemos dizer que uma
pesquisa cientfica estatisticamente planejada consiste nas seguintes etapas:

1. Enunciado do problema com formulao de hipteses.


2. Escolha dos fatores (variveis independentes) que devem ser
includos no estudo.
3. Escolha da unidade experimental e da unidade de observao.
4. Escolha das variveis que sero medidas nas unidades de
observao.
5. Determinao das regras e procedimentos pelos quais os diferentes
tratamentos so atribudos s unidades experimentais (ou vice-
versa).
6. Anlise estatstica dos resultados.
7. Relatrio final contendo concluses com medidas de preciso das
estimativas, interpretao dos resultados com possvel referncia a
outras pesquisas similares e uma avaliao dos itens de 1 a 6 (desta
pesquisa) com sugestes para possveis alteraes em pesquisas
futuras.

Ilustraes destas etapas com exemplos.

1. Enunciado do problema.
Como vimos uma pesquisa cientfica se inicia sempre com a formulao
de hipteses. Essas hipteses so primeiramente formuladas em termos
cientficos dentro da rea de estudo (hiptese cientfica) e em seguida em
termos estatsticos (hiptese estatstica) . Deve haver uma correspondncia
perfeita entre as hipteses cientfica e estatstica para evitar ambigidade.
Portanto, no enunciado do problema, a hiptese cientfica deve ser
formulada de maneira precisa e objetiva.

Estatstica Experimental
18

Exemplo:Um pesquisador est interessado em estudar o efeito de vrios


tipos de rao que diferem pela quantidade de potssio no ganho de peso de
determinado tipo de animal.
Este objetivo pode ser atingido se planejarmos a pesquisa com uma das
seguintes finalidades:
a) comparar as mdias dos aumentos de peso obtidas com cada uma
das raes (igualdade das mdias);
b) Estabelecer uma relao funcional entre o aumento do peso mdio e
a quantidade de potssio.

2. Escolha dos fatores e seus respectivos nveis.


No exemplo apresentado em 2.1, a varivel independente rao um
fator e os tipos de raes so os nveis deste fator, ou tratamentos. Assim, em
um experimento para se estudar o efeito de 4 raes e 3 suplementos no
ganho de peso de animais, temos dois fatores: rao com quatro nveis e
suplementos com 3 nveis. Podemos dizer que este experimento envolve 12
tratamentos, correspondentes s combinaes dos nveis dos dois fatores.
Pelo prprio conceito de fator, temos que em um experimento, a escolha
dos fatores e seus respectivos nveis basicamente um problema do
pesquisador. No entanto importante para o planejamento e anlise
distinguirmos as duas situaes, descritas a seguir:
a) uma fazenda de inseminao adquiriu 5 touros de uma determinada
raa para a produo de smen, e est interessada em realizar um
experimento para verificar se os cinco touros so homogneos
quanto a produo de smen.
b) A mesma fazenda de inseminao est interessada em realizar um
experimento para verificar se a produo de smen de touros, de
uma determinada raa, homognea. Como a populao de touros
da fazenda muito grande o pesquisador decidiu realizar um
experimento com uma amostra de touros (5 touros), mas as
concluses devem ser estendidas para a populao de touros.

Na situao descrita em a) dizemos que o fator touro fixo e na


situao em b) o fator touro aleatrio. A diferena fundamental entre estes
dois tipos de fatores , ento, que no caso de fatores fixos, as concluses se
referem apenas aos nveis do fator que esto presentes no experimento. No
caso de fatores aleatrios as concluses devem ser estendidas para a
populao de nveis.

3. Escolha da unidade experimental.


Em um grande nmero de situaes prticas a unidade experimental
determinada pela prpria natureza do material experimental. Por exemplo,
experimentos com animais, em geral a unidade experimental um animal. Em
outras situaes a escolha de outras unidades experimentais no to
evidente, exigindo do pesquisador juntamente com o estatstico algum estudo,
no sentido de escolher a unidade experimental mais adequada. A escolha de
uma unidade experimental, de um modo geral, deve ser orientada no sentido
de minimizar o erro experimental, isto , as unidades devem ser as mais
homogneas possveis, para, quando submetidas a dois tratamentos
diferentes, seus efeitos, sejam facilmente detectados.

Estatstica Experimental
19

4. Escolha das variveis a serem medidas.


As medidas realizadas nas unidades experimentais aps terem sido
submetidas aos tratamentos constituem os valores da varivel dependente. A
varivel dependente, em geral, pr-determinada pelo pesquisador, isto , ele
sabe qual varivel que ele quer medir. O que constitui problema, s vezes, a
maneira como a varivel medida, pois disto dependem a preciso das
observaes, e a distribuio de probabilidade da varivel a qual essencial
para a escolha do mtodo de anlise. Assim, por exemplo, se os valores de
uma varivel so obtidos diretamente por meio de um aparelho de medida
(rgua, termmetro, etc.) a preciso das observaes vai aumentar se, quando
possvel, utilizarmos como observao a mdia de trs medidas da mesma
unidade experimental. Com relao distribuio de probabilidade em muitas
situaes as observaes no so obtidas diretamente e sim por expresses
matemticas que as ligam a outros valores obtidos diretamente. Neste caso, a
distribuio de probabilidade das observaes vai depender da distribuio de
probabilidade da varivel obtida diretamente e da expresso matemtica que
as relaciona.
Portanto, as variveis, necessariamente presentes em um experimento
so: a varivel dependente, medida nas unidades experimentais, e o conjunto
de fatores (variveis independentes) que determinam as condies sob as
quais os valores da varivel dependente so obtidos.
Qualquer outra varivel que possa influir nos valores da varivel
dependente deve ser mantida constante.

5. Regras segundo as quais os tratamentos so atribudos s unidades


experimentais.
Nas discusses apresentadas em cada um dos itens anteriores a
colaborao da estatstica bem limitada exigindo-se a essencial colaborao
do pesquisador. Porm, o assunto discutido neste item o que poderamos
denominar de planejamento estatstico de experimento. Trata-se das regras
que associam as unidades experimentais aos tratamentos e que praticamente
determinam os diferentes planos experimentais, ou seja, a Aleatorizao ou
Casualizao. Lembramos, neste ponto, que os tratamentos so cada uma
das combinaes entre os nveis de todos os fatores envolvidos no
experimento.
Para que a metodologia estatstica possa ser aplicada aos resultados de
um experimento necessrio que em alguma fase do experimento, o principio
a ser obedecido o da Repetio, segundo o qual devemos ter repeties do
experimento para que possamos ter uma medida da variabilidade necessria
aos testes da presena de efeitos de tratamentos ou a estimao desses
efeitos.

Aleatorizao
Aleatorizao a designao dos tratamentos s unidades
experimentais, tal que estas tm a mesma chance (mesma probabilidade) de
receber um tratamento. Sua funo assegurar estimativas no-viesadas das
mdias dos tratamentos e do erro experimental. Nesta fase do planejamento de
um experimento j sabemos quais fatores sero estudados e o nmero de
nveis de cada fator que estaro presentes no experimento. Sabemos ainda
qual a unidade experimental escolhida e a varivel dependente. Podemos
imaginar que de um lado temos um conjunto

Estatstica Experimental
20

U de unidades experimentais, e de outro,


T um conjunto de tratamentos, que podem ser as combinaes dos
nveis de todos os fatores envolvidos. Precisamos estabelecer
esquemas que associam subconjuntos de elementos de U a cada
elemento de T. Vamos apresentar o esquema mais simples. Para
efeito de notao vamos supor que o conjunto U tem n elementos, o
conjunto T tem a elementos, e o nmero de elementos de U
submetidos ao tratamento Ti ni, com i=1, 2, ..., a, de tal modo que
k

n
i 1
i n.

O nmero de unidades experimentais ni para cada tratamento Ti


determinado a partir de informaes sobre a variabilidade das unidades
experimentais em termos da variabilidade da varivel dependente.
O plano completamente aleatorizado um esquema em que as
unidades experimentais que vo ser submetidas a cada tratamento so
escolhidas completamente ao acaso. Isto significa que cada unidade
experimental tem igual probabilidade de receber qualquer um dos tratamentos.
Por exemplo, um pesquisador quer realizar um experimento para
estudar o efeito de um resduo industrial que adicionado em raes de
animais. Ele suspeita que este resduo contenha uma substncia txica, cuja
presena no organismo, produz um aumento relativo de alguns rgos, como o
fgado, por exemplo. Aps uma entrevista com o pesquisador conseguimos as
seguintes informaes

O experimento ir envolver um nico fator, rao, com trs nveis: t1 -


rao normal, sem resduo industrial (grupo controle; t2 - rao normal
com o resduo tratado, e t3 - rao normal com resduo no tratado.
Portanto, o conjunto T tem trs tratamentos
Um conjunto U, formado por um grupo de 18 camundongos todos,
recm nascidos, com o mesmo peso inicial e homogneos com relao
s caractersticas genticas gerais. Por isto foi decidido distribuir
completamente ao acaso 6 animais para cada tratamento.
A varivel dependente (resposta) o peso relativo do fgado aps 90
dias do incio do experimento.
Uma maneira de se proceder ao sorteio a seguinte:
enumera-se as unidades experimentais de 1 a 18.
coloca-se os tratamentos em seqncia , por exemplo:
T1 T1 T1 T1 T1 T1 , T2 T2 T2 T2 T2 T2 , T3 T3 T3 T3 T3 T3
sorteia-se uma sequncia de 18 nmeros aleatrios. Pode-se obter,
por exemplo, a sequncia :
3, 1, 11, 15, 18, 16, 4, 5, 9, 12, 8, 7, 17, 14, 2, 6, 13, 10

Gerando uma seqncia de nmeros aleatrios no R:


# gerando uma sequencia de nmeros de 1 a 18
x<-seq(1:18)
x

# sequencia aleatria de tamanho 18 de x


sample(x,18,replace=F)

Estatstica Experimental
21

Sada fornecida pelo R


> # gerando uma sequencia de nmeros de 1 a 18
> x<-seq(1:18)
>x
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
>
> # sequencia aleatria de tamanho 18 de x
> sample(x,18,replace=F)
[1] 4 5 7 10 17 8 16 3 2 14 11 13 9 1 18 6 15 12

Distribuio das unidades experimentais aos tratamentos de acordo


com a seqncia gerada no R

Trat. Repeties
T1 u4 u5 u7 u10 u17 u8
T2 u16 u3 u2 u14 u11 u13
T3 u9 u1 u18 u6 u15 u12

Este plano experimental mais eficiente quanto maior for o grau de


homogeneidade entre as unidades experimentais em termos da varivel
dependente. Se as unidades experimentais so heterogneas o nmero n de
unidades experimentais necessrias para uma boa preciso pode ser muito
grande. Algumas alteraes no planejamento descrito, tal como, a introduo
de blocos, ou simplesmente a utilizao de uma co-varivel medida nas
unidades experimentais, a qual correlacionada com varivel dependente,
podem reduzir consideravelmente o erro experimental.
Observaes:
1) o plano experimental completamente aleatorizado no depende do
numero de fatores envolvidos e nem da maneira pela qual os
fatores so combinados.
2) Existem alguns fatores que pela prpria natureza, impe restries
na aleatorizao, porm para efeito de anlise, o experimento
considerado completamente aleatorizado.
Plano experimental em blocos
Quando o conjunto U de unidades experimentais for muito heterogneo
(em termos da varivel independente), o plano experimental completamente
aleatorizado torna-se pouco preciso, pois o erro experimental fica muito grande.
Em algumas situaes dispomos de informaes segundo as quais, antes da
realizao do experimento, possvel agruparmos as unidades experimentais
mais ou menos homogneas, em que a o nmero de tratamentos envolvidos
no experimento. Estes subconjuntos so denominados de blocos. Assim, a
maior parte da heterogeneidade interna do conjunto U expressa pela
heterogeneidade entre blocos. A distribuio das unidades experimentais entre
os tratamentos obedece a uma restrio imposta pelos blocos, isto , as a
unidades de cada bloco so distribudas aleatoriamente entre os tratamentos.
Na anlise de um experimento em blocos, alm dos fatores de interesse,
deve-se levar em conta o fator experimental bloco, diminuindo desta forma o
erro experimental. Quanto maior for a heterogeneidade entre blocos, maior a
eficincia deste plano experimental em relao ao completamente aleatorizado.
Exemplo: Um pesquisador deseja testar o efeito de trs tratamentos (T1,
T2, T3 ) no ganho de peso de ovelhas . Antes do inicio do experimento as

Estatstica Experimental
22

ovelhas foram pesadas e ordenadas de acordo com o peso e atribudas a 4


blocos. Em cada bloco tinham 3 animais aos quais os tratamentos foram
sorteados. Portanto, 12 animais foram usados.

Repetio
Repetio significa que o mesmo tratamento aplicado sobre duas ou
mais unidades experimentais. Sua funo fornecer uma estimativa do erro
experimental e dar uma medida mais precisa dos efeitos dos tratamentos. O
nmero de repeties requeridas em um particular experimento depende da
magnitude das diferenas que o pesquisador deseja testar e da variabilidade
da varivel dependente em que se esta trabalhando.

Estatstica Experimental
23

1 EXERCCIO PRTICO ESTATSTICA EXPERIMENTAL


1) Em um estudo gentico, uma alimentao regular era colocada em 20 frascos e o
nmero moscas de um determinado gentipo era contado em cada frasco. O nmero de
moscas tambm era contado em outros 20 frascos que continham suco de uva. O
nmero de moscas contados foram:
Nmero de moscas
Comida regular Suco de uva
15 20 31 16 22 22 23 33 38 28 6 19 0 2 11 12 13 12 5 16
25 20 21 23 29 26 40 20 19 31 2 7 13 20 18 19 19 9 9 9
(a) Calcule a mdia amostral, a varincia amostral, o desvio padro amostral e o
coeficiente de variao de cada conjunto de dados. Comente. Qual destes dois
conjuntos de dados tem maior variabilidade?
(b) Calcule a mdia amostral, a varincia amostral, o desvio padro amostral de cada
conjunto de dados utilizando os recursos imediatos de sua calculadora.
(c) Para cada conjunto de dados utilize o R para calcular a mdia, a mediana, o Q1, o
Q3, a observaes mnima e mxima, construa os grficos do Histograma, do Box-
Plot, e o grfico de barras com os desvio-padres para cada tipo de comida.
Comente os resultados.
2) Demonstre sua familiaridade com a notao da somatria, desdobrando-as e
calculando as seguintes expresses com
x1 = 1, x2 = -2, x3 = 4, e x4 = 5:
4
Dica para o item (a)
i
xi
1
x 1 x 2 x 3 x 4 1 (2 )
45 8
4 4 4 4 3
(a) xi
i 1
(b) 4x i
i 1
(c) (x i 3 ) (d)
i 1
(x i 4 )
i 2
(e)
i
1
(x i 4 ) 2

4 4 4
(f)
i
1
xi 2
(g)
i
(x i
1
2
2) (h)
i
(x i
1
2
4x i 4 )
3) Uma observao qualquer do conjunto de dados abaixo pode ser representada por yij ,
com o ndice i=1, 2, 3 controlando as linhas e j=1, 2, 3, 4, 5, 6 controlando as colunas.
Por exemplo, y23 = 100. Calcule as seguintes expresses (fazendo o desdobramento):
2
3 6 3 6 3 6 3 6
a) yi 2 b) y 2j c) y ij d) y ij 2
e) y ij

i 1 j
1 i j
1 1 i j
1 1 i 1 j 1
C1 C2 C3 C4 C5 C6
L1 550 950 950 750 650 700
L2 350 500 100 550 350 350
L3 600 450 150 500 100 250
4) Os dados a seguir referem-se ao nvel de glicose em sangue de 10 ces
56 62 63 65 65 65 65 68 70 72
Calcule manualmente e depois utilize o R para calcular: a) mdia; b) a mediana; c) mnimo e
mximo; d) os quartis Q1 e Q3. Construa o histograma e grfico tipo Box Plot. Comente a
respeito da disperso dos dados.
7) Determinaes de acar no sangue ( mg/ 100ml ) foram feitas em 5 raas de animais
experimentais, sendo 10 amostras por raa. Os resultados foram:
Raas
A B C D E
124 111 117 104 142
116 101 142 128 139
101 130 121 130 133
118 108 123 103 120
118 127 121 121 127
120 129 148 119 149
110 122 141 106 150
127 103 122 107 149
106 122 139 107 120
130 127 125 115 116

Estatstica Experimental
24

Utilize o R para calcular para cada raa: a) mdia; b) a mediana; c) desvio padro;
d) o erro padro; e) mnimo e mximo; f) os quartis Q1 e Q3. Construa o histograma, o
grfico tipo Box-Plot e o grfico de barras para cada raa. Comente a respeito da disperso
dos dados em cada raa.

Somatrio e Algebrismo
c) Seja Y a varivel tempo de recuperao da anestesia de tilpias, com 10 observaes:

Y = { 17,0; 8,9; 28,7; 20,5; 8,9; 26,1; 43,9 }


Calcular passo-a-passo:
7

7 yi
7
2

a) yi b) i1
c) Quadrado da Soma y i ;
i1 7 i 1
7 7
d) Soma de Quadrados y i2 ;
i 1
e) Suponha k = 15, calcule
i
ky i ;
1
f) Considerando-se Y como uma constante, desenvolva algebricamente o seguinte quadrado:
n

n yi

i
(y i
1
y )
2
, lembre-se que y i 1
n
1 n
g) Reescreva a expresso s
2
(y y )
n 1 i 1 i
2
em funo do desenvolvimento do item f.

h) Considere a varivel X tempo (segundos) de induo da anestesia para as mesmas 7


tilpias, respectivamente:
X = {165; 183; 161; 147; 146; 152; 174}
7
Calcule:
i
1
xi yi

Estatstica Experimental
25

Aula 2 Testes de significncia


1 Introduo
Um dos principais objetivos da estatstica a tomada de decises a respeito de
parmetros da populao com base nas observaes de amostras.

AMOSTRAGEM

x
MDIA MDIA
POPULACIONAL AMOSTRAL

INFERNCIA ESTATSTICA

POPULAO AMOSTRA

Ao tomarmos decises, conveniente a formulao de Hipteses


relativas s populaes, as quais podem ser ou no verdadeiras.

Exemplo: Um veterinrio est interessado em estudar o efeito de 4 tipos


de raes que diferem pela quantidade de potssio no aumento de peso de
coelhos.

H 0 : No existe diferena entre as raes, ou seja,


quaisquer diferenas observadasso devidas a fatores no controlados
H1 : As raes propiciam aumentos de pesos dist int os

H0 denominada de hiptese de nulidade, a qual assume que no existe


efeito dos tratamentos e H1 a contra hiptese.

Testes de hipteses ou testes de significncia


So os processos que nos permitem decidir se aceitamos ou rejeitamos
uma determinada hiptese, ou se os valores observados na amostra diferem
significativamente dos valores esperados (Populao)
2 Tipos de erros nos testes de significncia
QUADRO RESUMO: condies sobre as quais os erros Tipo I e Tipo II
podem ser cometidas
Condio da Hi ptese nula
H0 Verdadeiro H0 Falsa
Possvel Rejeio de H0 Erro Tipo I () Deciso correta
ao
No rejeio de H0 Deciso correta Erro Tipo II ()

Erro Tipo I: o erro cometido ao rejeitar H0, quando H0 verdadeira.


Erro Tipo II: o erro cometido ao aceitar H0, quando ela falsa. E
PErroTipo I ; e PErroTipo II

Estatstica Experimental
26

Esses dois erros esto de tal forma associados que, se diminuirmos a


probabilidade de ocorrncia de um deles, automaticamente aumentamos a
probabilidade de ocorrncia do outro. Em geral, controlamos somente o Erro
Tipo I, por meio do nvel de significncia (da vem a denominao de Testes
de Significncia) do teste representado por , o qual a probabilidade mxima
com que nos sujeitamos a correr um risco de cometer um erro do Tipo I, ao
testar a hiptese. Dado que rejeitar uma hiptese nula, (H0), verdadeira
constitui um erro, parece razovel fixarmos esta probabilidade de rejeitar uma
hiptese nula, (H0), verdadeira pequena, e de fato, isto que feito. Na prtica
comum fixarmos = 0,05 (5%) ou = 0,01 (1%).
Se, por exemplo, foi escolhido = 0,05, isto indica que temos 5
possibilidades em 100 de rejeitarmos a hiptese de nulidade (H0), quando na
verdade ela deveria ser aceita, ou seja, existe uma confiana de 95% de que
tenhamos tomado uma deciso correta, esta confiabilidade denominada grau
de confiana do teste e representada por 1 - e expressa em porcentagem.
Ns nunca saberemos qual tipo de erro estamos cometendo ao rejeitarmos ou
ao no rejeitarmos uma hiptese nula (H0), dado que a verdadeira condio
desconhecida. Se o teste nos leva deciso de rejeitar H0, podemos ficar
tranqilos pelo fato de que fizemos pequeno e, portanto, a probabilidade de
cometer o erro Tipo I bem pequena.

3 Teste F para a Anlise de Varincia (ANOVA)


O teste F a razo entre duas varincias e usado para determinar se
duas estimativas independentes da varincia podem ser assumidas como
estimativas da mesma varincia. Na anlise de varincia, o teste F usado
para testar a igualdade de mdias, isto , para responder a seguinte questo,
razovel supor que as mdias dos tratamentos so amostras provenientes de
populaes com mdias iguais? Considere o seguinte exemplo de clculo da
estatstica F; vamos supor que de uma populao normal N( , 2 ) foram
retiradas, aleatoriamente, 5 (n=5) amostras de tamanho 9 (r=9).
9

(y i y)
2

Calcule as mdias das 5 amostras e s i2 i1

(9 1)
(s ... s 52 )
2
Estime 2 por meio da frmula s 2 1
, a qual uma
5
mdia das varincias das amostras e ser denominada de
variabilidade dentro das amostras ( s D2 ).
Estime a varincia populacional das mdias y2 , por meio das
5

(y i2
y )
2

mdias das 5 amostras: s y2 i1

5 1
De s ,2
y estime novamente 2, usando a relao
s2
s y2 , ou s 2 rs y2 , denominada de variabilidade entre as
r
amostras ( s E2 ).

Estatstica Experimental
27

s E2
Calcule Fc 2
sD
A estimativa de s E2 do numerador foi feita com base em n - 1 = 4 graus
de liberdade (n o nmero de amostras) e a estimativa de s D2 do denominador
foi feita com base em n(r 1) = 5(9-1) = 40. A repetio deste procedimento
amostral muitas vezes gera uma populao de valores de F, os quais quando
colocados em um grfico de distribuio de freqncia tem o seguinte formato

Distribuio F(4,40,0.05)
0.7
0.6
0.5

2,61
Probabilidade

0.4
0.3

95% 5%
0.2
0.1
0.0

0 1 2 3 4

O valor de F = 2,61 o valor acima do qual, 5% dos valores de F


calculados tm valor acima dele. Este o valor para um nvel de 5%
encontrado na Tabela F para 4 e 40 graus de liberdade (veja Tabela F). Dado
que as estimativas da varincia utilizadas no clculo da estatstica F so
estimativas da mesma varincia 2 , espera-se que o valor de F seja bem
prximo de 1, a menos que um conjunto de amostras no usual foi retirado.
Para qualquer conjunto de amostras retiradas de n = 5 e r = 9 a probabilidade
(ou a chance) de um valor de F calculado ser maior ou igual a 2,61 0,05 (5%)
(P [F 2,61] 0,05 )
.
As hipteses estatsticas que testamos quando aplicamos o teste F so
H 0 : 12 22
H 1 : 12 22
A hiptese H0 estabelece que as duas varincias populacionais so
iguais, o que equivale a admitir que as amostras foram retiradas da mesma
populao. A hiptese H1 (contra hiptese, ou hiptese alternativa) estabelece
que as varincias so provenientes de populaes diferentes e, mais ainda, a
varincia da primeira maior que a varincia da segunda. Os valores de F so
tabelados em funo dos graus de liberdade das estimativas de s2 do
numerador (n1) e do denominador (n2) no clculo da estatstica F e para
diferentes valores de nveis de significncia (5%, 1%, etc.). Tambm podem ser
fornecidos por comandos do programa R.

Estatstica Experimental
28

Regra de deciso para o teste da estatstica F


Todos os possveis valores que o teste estatstico pode assumir so pontos no
eixo horizontal do grfico da distribuio do teste estatstico e dividido em
duas regies; uma regio constitui o que denominamos de regio de rejeio e
a outra regio constitui o que denominamos de regio de no rejeio. Os
valores do teste estatstico que formam a regio de rejeio so aqueles
valores menos provveis de ocorrer se a hiptese nula verdadeira, enquanto
que os valores da regio de aceitao so os mais provveis de ocorrer se a
hiptese nula verdadeira. A regra de deciso nos diz para rejeitar H0 se o
valor do teste estatstico calculado da amostra um dos valores que est na
regio de rejeio e para no rejeitar H0 se o valor calculado do teste
estatstico um dos valores que est na regio de no rejeio. O
procedimento usual de teste de hipteses baseado na adoo de um critrio
ou regra de deciso, de tal modo que = P(Erro tipo I) no exceda um valor
pr-fixado. Porm, na maioria das vezes, a escolha de arbitrria. Um
procedimento alternativo consiste em calcular o menor nvel de significncia
para o qual a hiptese H0 rejeitada, com base nos resultados amostrais. Este
valor, denominado de nvel descritivo do teste ou nvel mnimo de significncia
do teste, ser denotado por valor de p ( p-value). Todos os modernos
programas computacionais fornecem este valor nos testes estatsticos.
A representao grfica a seguir mostra uma ilustrao da regra de
deciso do teste F, visto anteriormente,
Distribuio F(4,40,0.05)
0.7
0.6
0.5
Probabilidade

0.4

2,61
0.3
0.2

95% 5%
0.1
0.0

0 1 2 3 4

Regio de no rejeio Regio de rejeio

Exemplo: Amostras aleatrias simples e independentes, aps dois tipos


de esforos, do nvel de glicose no plasma de ratos aps uma experincia
traumtica forneceram os seguintes resultados:
Esforo 1: 54 99 105 46 70 87 55 58 139 91
Esforo 2: 93 91 93 150 80 104 128 83 88 95 94 97
Estes dados fornecem suficiente evidncia para indicar que a varincia
maior na populao de ratos submetidos ao esforo 1 do que nos ratos
submetidos ao esforo 2. Quais as suposies necessrias para se aplicar o
teste?

Estatstica Experimental
29

Soluo:
As varincias amostrais so s12 852,9333 e s22 398,2424 ,
respectivamente.
Suposies: Os dados constituem amostras aleatrias
independentes retiradas, cada uma, de uma populao com
distribuio normal. (Esta a suposio geral que deve ser
encontrada para que o teste seja vlido).
Hipteses estatsticas

H 0 : 12 22
H 1 : 12 22
Clculo do Teste Estatstico

s12 852,9333
Fc 2,1417
s 22 398,2424
Distribuio do Teste Estatstico: quando H0 verdadeira a
estatstica F tem distribuio F com n1 1 e n2 1 graus de
liberdade, ou seja, F(9,11, 0,05 ).
Regra de Deciso: fazendo 5% , o valor crtico de
F(9,11, 0,05 ) 2,896 , ento, rejeita-se H0 se Fc 2,896 . A ilustrao
grfica desta regra de deciso mostrada a seguir,
Distribuio F(4,40,0.05)
0.7
0.6
0.5
Probabilidade

0.4

2,1417
0.3

2,896
0.2
0.1
0.0

0 1 2 3 4

Regio de no rejeio Regio de rejeio

Deciso estatstica: no podemos rejeitar H0, dado que


2,1417<2,896; isto , o Fc calculado caiu na regio de no rejeio.
Concluso: no podemos concluir que as varincias dos esforos 1 e
2 so diferentes, o nvel mnimo de significncia do teste p=0,1168
(p>0.05)
Script no R para o teste F

Estatstica Experimental
30

# definio das varincias das amostras e do nvel de significncia (alfa)


alfa<-0.05
v.y1<-852.933;v.y2<-398.2424;n.y1<-10;n.y2<-12

# calculo da estatstica F
fc<-v.y1/v.y2
fc

# valor terico desta distribuio para alfa=0,05


ft<-qf(1-alfa,n.y1-1,n.y2-1)
ft

# valor de p associado a estatstica calculada fc


valor.p<-1-pf(fc,n.y1-1,n.y2-1)

Exemplo da construo do grfico de uma distribuio F com graus de


liberdade 5 e 6 e a 5%.
#valor tabelado da distribuio F(5, 6.,0,05) junto com o grfico
ft=qf(0.95,5,6)

# valor tabelado
ft

# grfico da distribuio
xv<-seq(0,4,0.01) # gerando uma sequncia de nmeros de 0 a 4
yv<-df(xv,4,40) # gerando os valores de
# distr. F(4,40) com a sequencia xv
plot(xv,yv,type="l",main="Distribuio F(4,40,0.05)",
ylab="Probabilidade",xlab="",lwd=3) # grfico da distribuio F
fcr=qf(0.95,4,40);fcr # valor crtico para alfa=5%
lines(c(fcr,fcr),c(0,0.6),
col=2,lwd=2,pch=2) # linha sinalizando o valor crtico
# preenchimento da rea sob a curva acima do valor crtico
polygon(c(xv1[xv1>=2.605975],2.605975),
c(yv1[xv1>=2.60975],yv1[xv1==4]),col="red")

4 Anlise de varincia
Embora o teste F possa ser aplicado independentemente, a sua maior
aplicao na anlise de varincia dos Delineamentos Experimentais. Vamos
considerar os seguintes dados de Delineamento Inteiramente Casualizado,
(DIC).
Repeties
Tratamentos 1 2 3 4
A 12,4 15,2 14,3 12,6 e2
B 13,2 16,2 14,8 12,9
C 12,1 11,3 10,8 11,4
D 10,9 9,8 9,4 8,3

e2 T2
Dentro de um mesmo tratamento o valor observado nas diferentes
repeties no o mesmo, pois estes valores esto sujeitos variao ao

Estatstica Experimental
31

acaso ( 2e ). Quando passamos de um tratamento para outro, os dados tambm


no so iguais, pois estes esto sujeitos a uma variao do acaso acrescida de
uma variao devida ao efeito do tratamento, i., e2 T2

Quadro da anlise de varincia do DIC


Considere os dados do exemplo anterior, onde tnhamos 4 tratamentos
(k=4) e 4 repeties. A Tabela da Anlise de varincia fica sendo

Fonte de variao G.L. Soma de Quadrados Quadrado mdio Estatstica F

Entre k-1 k
y (y ) 2 2 S .Q .Trat . Q .M .Trat .

i 1 r

kr
i
k 1 Q .M . Re s .

Dentro n-k k r k
(y i )
2
S .Q .Re s .

i
1j
y ij
i1
2

1 r kr k

Total n-1 k r
(y )2


i j
y ij
1 1
2

kr

Deste quadro notamos que o Quadrado mdio do resduo estima a


variao casual (do resduo) e2 . Enquanto que o quadrado mdio dos
tratamentos estima a variao casual (resduo) acrescida de uma possvel
varincia devido ao efeito dos tratamentos ( e2 T2 ), ento
e2 T2
F
e2
Se no houver efeito dos tratamentos os dois quadrados mdios
(Quadrado mdio dos tratamentos e quadrado mdio do resduo) estimam a
mesma varincia, o que implica o valor de F 1,0, e qualquer diferena que
ocorra entre os valores mdios dos tratamentos meramente casual.

5 Teste t Student.
Considere uma outra retirada de amostras repetidas de um determinado
tamanho, por exemplo, r = 5 de uma populao normal. Para cada amostra
calcule a mdia y o desvio padro, s , o erro padro da mdia s y e uma outra
estatstica
y
tc
sy
Graficamente temos
Populao Normal
0.4
0.3
Probabilidade

0.2
0.1
0.0

-3 -2 -1 0 1 2 3

Estatstica Experimental
32

(y i y)
2

s2 y
amostra 1 s 12 ;s y 1 1 ; t 1 1
5 1 5 s y1
amostra 2 .......... .......... .......... .......... .......... .........

(y i y)
2

s2 y
amostra m s m2 ;s y m 1 ; t m 1
5 1 5 s y1
Organizando estes milhares de valores da estatstica t em distribuio
de freqncia. Esta distribuio de freqncia tem a seguinte forma
0.3 Distribuio t-student com 4 graus de liberdade
Probabilidade

0.2

rea 95%
0.1

Valor crtico: -2,77 Valor crtico: 2,77


0.0

-3 -2 -1 0 1 2 3 rea 2,5%
rea 2,5%

Existe uma nica distribuio t para cada tamanho de amostra. Neste


exemplo em que r = 5 (repeties = 5), 2,5 % dos valores de t sero maiores ou
iguais do que 2,776 e 2,5% sero menores ou iguais do que -2,776. Os valores
da estatstica t student so apresentados em tabelas (ver Tabela da
distribuio t ). Por exemplo, para 10 graus de liberdade, o valor tabelado
esperado para t com probabilidade de 0,01 (1%) 3,169. A distribuio t
student converge rapidamente para a distribuio normal. Quanto maior for a
amostra maior aproximao da distribuio t student com a distribuio
normal. Quando os valores de t so calculados em amostras de tamanho r =
60, estes so bem prximos dos valores da distribuio normal.
Script no R para a obteno dos valores tericos da distribuio t-
student
#valor terico da distribuio t-student pela funo qt( ) para alfa=0.01 e 10
#graus de liberdade
alfa<-0.01
qt(1-alfa/2,10)

#valor terico da distribuio t-student para alfa=0.05 e 10 graus de liberdade


alfa<-0.05
qt(1-alfa/2,10)

Regra de deciso para a estatstica t-student

Estatstica Experimental
33

Todos os possveis valores que o teste estatstico pode assumir so


pontos no eixo horizontal do grfico da distribuio do teste estatstico e
dividido em duas regies; uma regio constitui o que denominamos de regio
de rejeio e a outra regio constitui o que denominamos de regio de
aceitao. Os valores do teste estatstico que formam a regio de rejeio so
aqueles valores menos provveis de ocorrer se a hiptese nula verdadeira,
enquanto que os valores da regio de aceitao so os mais provveis de
ocorrer se a hiptese nula verdadeira. A regra de deciso nos diz para
rejeitar H0 se o valor do teste estatstico calculado da amostra (tc) um valor
que est na regio de rejeio e para no rejeitar H0 se o valor calculado do
teste estatstico um dos valores que est na regio de aceitao. Em
particular, no caso do teste t student a regra de deciso fica sendo: rejeita-se
H0 se t c t . Outra forma de se tomar deciso sobre rejeitar ou no
(n 1, )
2
rejeitar H0 pelo valor de p associado ao valor calculado da estatstica tc . Se
p 0,05 no se rejeita H0 , caso contrrio ( p 0,05 ) rejeita-se H0 . Neste caso
no h necessidade de se consultar a Tabela terica da distribuio t-student.
Exemplo: Em um hospital veterinrio amostras de soro de amilase de 15
animais sadios e 22 animais hospitalizados foram colhidas. Os resultados da
mdia e dos desvios-padres foram os seguintes:
y1 120 unidades / ml, s1 40 unidades / ml
y 2 96 unidades / ml, s2 35 unidades / ml
Neste exemplo, o erro padro amostral s y da frmula da estatstica t,
ser substitudo pelo erro padro da mdia pooled, ou seja,
(r1 1)s 12 (r 2 1)s 22
sP
2

(r1 1) (r 2 1)
Clculos:
Suposies: os dados constituem duas amostras independentes,
cada uma, retirada de uma populao normal. As varincias
populacionais so desconhecidas e assumidas iguais;
H : 2
Hipteses: 0 1 ;
H 1 : 1 2
(y y 2 ) (1 2 )
Teste estatstico: t c 1 ;
s p s p2
2


r1 r 2

Estatstica Experimental
34

Distribuio do teste estatstico: quando H0 for verdadeira, o teste


segue uma distribuio t Student com r1 + r2 2 graus de liberdade;
Regra de deciso: Rejeita-se H0 se t c t , neste exemplo,
(r1r2 2; )
2

t c 2,030 ;
Clculo do teste estatstico: primeiro o clculo da varincia amostral
2 2
14(40 ) 21
(35 )
s p2 1375 e
14 21
(120 96 )0 24
tc 1,93
1375 1375 12,42

15 22
Deciso estatstica: no se rejeita H0, visto que
- 2,030 1,88 2,030 , ou seja, 1,88 est na regio de no rejeio;
Concluso: com base nestes dados no podemos concluir que as
mdias das duas populaes so diferentes. Neste teste o nvel
mnimo de significncia do teste p= 0,069 (p>0,05).
Script no R para resolver o exemplo acima
# definio das mdias, dos desvio padres e do tamanho das amostras
m.y1<-120;m.y2<-96;sd.y1<-40;sd.y2<-35;n.y1<-15;n.y2<-22

# calculo da varincia pooled


v.pool<-((n.y1-1)*sd.y1^2+(n.y2-1)*sd.y2^2)/((n.y1-1)+(n.y2-1))
v.pool

# calculo da estatistica t
tc<-(m.y1-m.y2)/sqrt(v.pool/n.y1+v.pool/n.y2)
tc
# valor de t tabelado a 5% e 35 graus de liberdade
alfa<-0.05
t.tab <- qt(1-alfa/2,35)
t.tab

# valor de p correspondente a este valor de t


# multiplica-se o valor de p por 2 pois o teste bi-lateral
valor.p <- 2*(1-pt(tc,35))
valor.p

Estatstica Experimental
35

2 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL


1- A tabela abaixo mostra a porcentagem de gordural corporal para vrios homens e mulheres.
Estas pessoas participaram de um programa de controle de peso de trs vezes por semana por
um ano. As medidas referem-se a porcentagem de gordura de seus corpos.
Homens 13,3 19,0 20,0 8,0 18,06 22,0 20,0 31,0 21,0
12,0 16,0 12,0 24,0
Mulheres 22,0 26,0 16,0 12,0 21,7 23,2 21,0 28,0 30,0
23,0
a) Faa um grfico de barras e um grfico boxplot para cada grupo
a) Quais as suposies sob as quais o teste F pode ser aplicado.
b) Podemos concluir que a variabilidade do grupo das mulheres seja maior que o do grupo
homens. (Use 0 ,05 e 0 ,01 ).

2- Em um estudo, a seguintes contagens de linfcitos foi obtido em vacas de dois anos da raa
Holstein e de vacas de dois anos da raa Guernseys. Os resultados esto na Tabela abaixo:
Holstein 5166 6080 7290 7031 6700 8908 4214 5135 5002
4900 8043 6205 3800
Guernseys 6310 6295 4497 5182 4273 6591 6425 4600 5407
5509
Calcular:
a)- a mdia geral, um grfico de barras, um grfico boxplot para cada raa, a mdia de cada
raa, a varincia amostral e o desvio-padro de cada raa;
b)- declare as suposies sob as quais o teste t student, para amostras independentes, pode
ser aplicado;
c)- teste se as varincias das duas populaes so iguais. (Teste F)
d)- em funo do resultado do teste do item c) podemos concluir que a contagem de linfcitos
nas duas raas diferem assumindo que as varincias so desconhecidas e iguais? Considere
5% .
3- Retirou-se 5 amostras de tamanho 5 de uma populao N( , 2). Para cada amostra foi
aplicado um antiparasitrio (tratamentos). Em seguida os pesos dos animais foram analisados
para cada tratamento. Teste se existe efeito de antiparasitrio no peso dos animais, ou seja,
teste a hiptese estatstica,
H 0 1 2 ... 5
H 1 i j para i j
Os tratamentos (antiparasitrios) e os pesos, em quilogramas, dos animais esto dados na
tabela abaixo:
Tratamentos
Neguvon Methiridim TH Haloxon Controle
330 315 298 286 279
314 304 289 273 240
331 307 273 269 266
311 320 240 278 269
320 305 121 274 250
(Mdia) ( y j )

(Varincia) S i
2

(Desvio padro) S i
Roteiro dos clculos:
a)- Faa uma estimativa da 2 atravs de:
5

s 12 s 22 ... s 52 (y j y)
2

s D2 e de s E2 rs y2 , sendo s y2 i
1

5 5 1

Estatstica Experimental
36

s E2
Calcule a estatstica F 2 e compare com o valor terico da distribuio F a 5%, sendo SD
sD
= varincia dentro dos tratamentos e SE = varincia entre os tratamentos.

4- Obter por meio das tabelas das distribuies F e t os valores de


a)- F(5, 6, 0,05 ) ; F(5, 6, 0,01); F(10, 15, 0,05 ); F(10, 15, 0,01); F(11, 12, 0,05 ); F(11, 12, 0,01).
b)- t(7, 0,05 ); t(7, 0,01); t(15, 0,025 ); t(16, 0,05 ); t(10, 0,10 ); t(18, 0,20 );
(faa os desenhos das distribuies com os respectivos valores). Finalmente, obtenha os
mesmos valores e os mesmos grficos no R

Estatstica Experimental
37

Aula 3- Delineamento inteiramente casualizado (DIC)


1 Introduo
O DIC mais simples dos delineamentos. Os tratamentos se distribuem
ao acaso em todas as unidades experimentais e o nmero de repeties por
tratamento pode ser igual ou diferente. O DIC muito utilizado para estudos
de mtodos, tcnicas de trabalhos em laboratrio, ensaios de vegetao e em
experimentos com animais. Para sua aplicao, h necessidade que o meio
atue de forma uniforme em todas as unidades experimentais e que estas sejam
facilmente identificadas para receber o tratamento.
Vamos comear com um exemplo:
Em um estudo do efeito da glicose na liberao de insulina, 12
espcies de tecido pancretico idnticas foram subdivididas em trs
grupos de 4 espcies cada uma. Trs nveis (baixo - tratamento 1,
mdio tratamento - 2 e alto tratamento - 3) de concentraes de
glicose foram aleatoriamente designados aos trs grupos, e cada
espcie dentro de cada grupo foi tratado com o nvel de
concentrao de glicose sorteado a eles. A quantidade de insulina
liberada pelos tecidos pancreticos amostrados so as seguintes:

33

Tratamento Repeties Total Mdia Varincia


1 2 3 4 ri
T1 1,59 1,73 3,64 1,97 4 8,93 2,23 0,91
T2 3,36 4,01 3,49 2,89 4 13,75 3,44 0,21
T3 3,92 4,82 3,87 5,39 4 18,00 4,50 0,54
Total 12 40,68
Este um estudo experimental com 12 unidades experimentais (amostras de
tecido pancretico) e k=3 tratamentos. Cada tratamento um nvel de fator
simples: concentrao de glicose. Existem 4 repeties para cada tratamento.
Os dados, quantidade de insulina liberada pelo tecido pancretico podem ser
considerados como trs amostras aleatrias, cada uma com r=4 repeties, ou
de tamanho r=4 sorteadas de trs populaes.

Estatstica Experimental
38

Dado que os tratamentos so designados s unidades experimentais


completamente ao acaso, este delineamento denominado de
DELINEAMENTO INTEIRAMENTE AO ACASO (DIC). Em geral, em um DIC,
um nmero fixo de k tratamentos so sorteados s N unidades experimentais
de tal forma que o i-simo tratamento sorteado a exatamente ri unidades
experimentais. Assim, ri o nmero de repeties do i-simo tratamento e
r1 r2 r3 ... rk N . No caso em que ri so iguais, i.., r1 r2 r3 ... rk r ,
ento N rk e o delineamento balanceado.
Notao:
Repeties
1 2 3 ... j ... r Total Mdia
Tratamento
1 y11 y12 y13 ... ... ... y1r y 1 y 1
2 y21 y22 y23 ... ... ... y2r y 2 y 2
3 y31 y32 y33 ... ... ... y3r y 2 y 2
. . . . . ... . . . .
. . . . . ... . . . .
. . . . . ... . . . .
i . . . . yij . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
k yk1 yk2 yk3 ... ... ... ykr y k y k
y y
N=rk
Convenes:
y i e y i representam, respectivamente, o total e a mdia do i-
simo tratamento, respectivamente,
y e y representam, respectivamente, o total geral (soma de
todas as observaes) e a mdia geral de todas as observaes.

2 Quadro da Anlise de Varincia (ANOVA)


O mtodo da anlise de varincia pode ser visto como uma extenso do
teste t de student para amostras independentes. Como no teste t de amostras
independentes, o mtodo da ANOVA compara uma medida da magnitude da
variabilidade observada dentro das k amostras com uma medida da
variabilidade entre as mdias das k amostras.

3 Modelo matemtico do DIC com efeitos de tratamentos fixos


O modelo associado ao DIC com efeitos fixos
y ij i eij ,
sendo,
y ij a observao na unidade experimental que recebeu o i-simo
tratamento na j-sima repetio;
a mdia geral comum a todas as observaes definida como
k

r i i
i1
, com i a mdia populacional do i-simo tratamento;
N

Estatstica Experimental
39

i o efeito do i-simo tratamento na varivel dependente Y e mede


o afastamento da mdia i em relao a , isto , i i ; e
eij um erro casual no observvel.
Pela definio de e i acima, temos que este modelo possui a
k k k k
restrio n i i i 0, pois, ni i n( n i i n i 0 .
i i )
i 1 i 1 i 1 i 1

4 Suposies associadas ao modelo


As suposies usualmente associadas aos componentes do modelo do
DIC so que os e ij so variveis aleatrias independentes e identicamente
distribudas com distribuio N( 0 , 2 ) . Como os y ij so funes lineares dos
e ij , das suposies sobre os erros decorre que:
E( y ij ) i i ;
Var ( y ij ) 2 ;
y ij so normalmente distribudos e independentes, ou,
resumidamente que y ij ~ N( i , ) . 2

Portanto, estamos supondo que as observaes do experimento a ser


analisado correspondem a amostras aleatrias de k populaes normais com a
mesma varincia e que podem ou no ter mdias diferentes. A figura abaixo
representa graficamente esse fato, considerando, no caso, trs tratamentos.

3
1

1 2 3

Figura: Ilustraes das suposies do modelo matemtico associado ao


DIC com um fator fixo.

5 Hipteses estatsticas
A Hiptese geral :
H0 : 1 2 ... k 0 ,
ou seja, vamos testar a no existncia de efeito do fator (tratamento).

6 Partio da soma de quadrados


Voltemos ao quadro de representao das observaes no DIC na
pgina 30

Podemos identificar os seguintes desvios:

Estatstica Experimental
40

y ij y , como o desvio de uma observao em relao a mdia


amostral geral;
y ij y i , como o desvio da observao em relao mdia de seu
grupo ou do i-simo tratamento;
y i y , como o desvio da mdia do i-simo tratamento em
relao mdia geral.
Consideremos a identidade

(y ij y )
(y ij y i )
(y i y )
,
a qual diz que a a variao de uma observaes em relao mdia geral
amostral igual soma variao desta observao em relao mdia de
seu grupo com a variao da mdia do i-simo tratamento em que se encontra
esta observao em relao mdia geral amostral . Elevando-se ao
quadrado os dois membros da identidade acima e somando em relao aos
ndices i e j, obtemos:
k ri k ri k

( y
i 1 j 1
ij y ) ( yij yi ) ri ( yi y )2 ,
2

i 1 j 1
2

i 1
os duplos produtos so nulos.
O termo
k ri


i j
(y ij y
1 1

2
) ,

denominado de Soma de Quadrados Total e vamos denot-lo por SQT.O


nmero de graus de liberdade associado SQT kr - 1, ou N 1, pois temos N
observaes e a restrio
k ri

( y
i 1 j 1
ij y ) 0 .

A componente:
k ri


i j
(y ij y i
1 1
)
,

denominada de Soma de Quadrados Residual, representada por SQR, e


uma medida da homogeneidade interna dos tratamentos. Quanto mais
prximas estiverem as observaes dentro de cada grupo (tratamento), menor
a SQR. Notem que a magnitude da SQR no depende da diferena entre as
mdias dos tratamentos. Considerando apenas o i-simo tratamento, temos
que
ri


j
(y ij y i
1

2
)

possui ri 1 graus de liberdade. Assim, o nmero de graus de liberdade


associado SQR :
k


i
1
(ri kr k N k .
1)
k
A componente
i
1
r(
i yi y )
2
, mede a variabilidade entre as mdias

dos tratamentos e por isso denominada de Soma de Quadrados Entre


Tratamentos, representada por SQTr. Quanto mais diferentes entre si forem

Estatstica Experimental
41

as mdias dos tratamentos, maior ser a SQTr. Desde que temos k


tratamentos e a restrio de que
k


i
r(
1
i yi y )
0,

A SQTr possui k - 1 graus de liberdade. Com esta notao, podemos


escrever que:
SQT = SQR + SQTr.

6 Quadrados mdios
Dividindo a SQR e SQTr pelos seus correspondentes graus de
liberdade, obtemos, respectivamente o Quadrado Mdio Residual (QMR) e o
Quadrado Mdio Entre Tratamentos (QMTr), isto ,
SQR SQTr
QMR e QMTr
N k k 1

7 Estatstica e regio crtica do teste


A estatstica para o teste
QMTr
Fc ,
QMR
a qual, deve ser prximo de 1 se H0 for verdadeira, enquanto que valores
grandes dessa estatstica so uma indicao de que H0 falsa. A teoria nos
assegura que Fc tem, sob H0 distribuio F Snedecor com (k -1) e (N k)
graus de liberdade. Resumidamente, indicamos:
Fc ~ F(k 1,N K ), sob H 0 .
Rejeitamos H0 para o nvel de significncia se
Fc F(k 1,N K , ),
sendo, F( k 1 , N K , ) o quantil de ordem (1 ) da distribuio F-Snedecor com
(k -1) e (N k) graus de liberdade. Graficamente temos:

8 Quadro da anlise de varincia (ANOVA)

Dispomos as expresses necessrias ao teste na Tabela abaixo


denominada de Quadro de Anlise de Varincia (ANOVA).

Estatstica Experimental
42

Fonte de variao g.l. SQ QM Fc

Y i 2 (Y )
ri 2 SQTr QMTr
QMTr
Tratamentos (Entre) k-1
i 1 ri N k 1 QMR
k r k
(Y i )
2 SQR
Yij2 QMR
Resduo (dentro dos trat.) N-k
i 1 j 1 i 1 r N k
k r
(Y )
2

TOTAL N-1 Yij2


i 1 j 1 N
Pode-se provar que:
E(QMR ) 2 , ou seja, QMR um estimador no viesado da
varincia 2 ;
r k
E(QMTr ) 2 i , ou seja, QMTr um estimador no
(k 1)i 1
viesado da varincia 2 se a hiptese H 0 : 1 2 ... k 0
verdadeira.

9 Detalhes dos clculos


Apresentaremos alguns passos que facilitam os clculos das somas de
quadrados da ANOVA.
(y ) 2
Calcule a correo para a mdia CM ;
N
Calcule a Soma de Quadrados dos Totais (SQT)
k ri
SQT y ij2 CM ;
i 1 j 1

Calcule a Soma de Quadrados Entre os Tratamentos (SQTr)


ri
Y2
SQTr i CM ;
i 1 ri

Calcule a Soma de Quadrados Residual (SQR) pela diferena, isto


, SQR SQT SQTr ;
Calcule os Quadrados Mdios Entre os Tratamentos (QMTr) e o
SQTr SQR
Quadrado Mdio Residual (QMR) QMTr e QMR
k 1 N k
QMTr
Calcule Fc para tratamentos Fc
QMR
Notem que estas frmulas computacionais assumem que existe ri
repeties para o i-simo tratamento; consequentemente, para um experimento
balanceado com r repeties para cada tratamento, ri deve ser substitudo por
r. Estas vrias soma de quadrados obtidas nestes cinco passos podem ser
resumidas no quadro da ANOVA apresentado no item 8.
10 Exemplo 1
Vamos considerar os dados apresentados no item 1. Desejamos testar a
hiptese nula
H 0 : 1 2 3
H 1 : i j para pelo menos um par i j

Estatstica Experimental
43

Os clculos para montarmos o quadro da ANOVA so: temos k = 3, r =


4, e N = 3 x 4 =12. Ento
Graus de liberdade:
Total N 1 12 1 11;Trat. k 1 3 1 2
Re siduo N k 12 3 9
2
(40,68 )
CM 137,91
12
SQT (1,59 ) 2
(1,73 )2
... (5,39 )2
CM 153,18 137,18 15,28
2 2
( 8 ,93 ) (13 ,75 ) (18 ,00 ) 2
SQTr CM 148,20 137 ,91 10 ,30
4 4 4

SQR SQT SQTr 15 ,28 10,30 4 ,98


10 ,30 4 ,98
QMTr 5 ,15 e QMR 0 ,55
2 9
QMTr 4 ,98
Fc 9 ,31
QMR 0 ,55
O quadro da ANOVA para a varivel insulina liberada o seguinte:
Fonte de var. g.l. SQ QM Fc

Tratamentos (Entre) 2 10,30 5,15 9,31


Resduo (dentro dos tratamentos) 9 4,98 0,55
TOTAL 11 15,28

Das tabelas das distribuies F, temos que


F( 2 ,9 , 0 ,05 ) 4 ,257 e F( 2 ,9 , 0 ,01 ) 8 ,022 . O valor Fc=9,31 maior do que estes
valores tabelados, ento rejeitamos a hiptese nula H0 para 0 ,01, ou 1%
de probabilidade (se significativo a 1%, logo tambm significativo a 5%).

Podemos concluir que, para um nvel de 0 ,01, ou 1% , que a quantidade de


insulina liberada diferente para pelo menos dois nveis de glicose.
Script da resoluo do exemplo 1 no R
#
# exemplo 1 da Aula 3 (DIC) pg 36
#

# entrando com o nmero de repeties


r <- 4

Estatstica Experimental
44

# entrando com os dados


insulina <- c(1.59, 1.73, 3.64, 1.97, 3.36, 4.01, 3.49, 2.89, 3.92, 4.82, 3.87,
5.39)

# entrando com os nveis da insulina (Tratamentos)


trat <- c(rep("Baixo", r), rep("Medio", r), rep("Alto", r))
m.geral<- mean(insulina) # calculando a mdia geral

# estabelecendo o objeto trat com fator e guardando no prprio objeto trat


trat <- factor(trat)
trat

# armazenando os nomes dos nveis dos fatores


n.trat <- levels(trat)

# aplicando o comando tapply ao objeto insulina para o clculo dos


# totais dos tratamentos
t.trat <- tapply(insulina, trat, sum)
t.trat

# aplicando o comando tapply ao objeto insulina para o clculo das


# mdias dos tratamentos
m.trat <- tapply(insulina, trat, mean)
m.trat

# aplicando o comando tapply ao objeto insulina para o clculo dos


# desvio-padres dos tratamentos
sd.trat <- tapply(insulina, trat, sd)
sd.trat

# mostrando o s grficos box plot para cada tratamento


boxplot(insulina~trat, horizontal=T,xlab="Quantidade de
insulina",col="blue")

boxplot(insulina~trat, vertical=T,ylab="Quantidade de
insulina",col="green")

# fazendo a anlise de varincia


insulina.av <- aov(insulina~trat)

#imprimindo o quadro da anova


summary(insulina.av)

Quadro da anova fornecido pelos comandos bsicos do R

Df Sum Sq Mean Sq F value Pr(>F)


trat 2 10.2967 5.1483 9.3054 0.006445 **
Residuals 9 4.9794 0.5533
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Estatstica Experimental
45

Notem que os comandos do script acima no fornecem os resultados do


da fonte de variao do Total e por outro lado fornecem uma coluna a mais
referente a Pr(>Fr) com o valor de p (p-value) da estatstica F.
Outra forma de obter o quadro da ANOVA pela funo crd( ) do pacote
ExpDes. Pacotes (packages) ou bibliotecas (library) so os nomes mais
usados para designar conjuntos de funes, exemplos, e documentaes
desenvolvidas para determinadas tarefas. Os comandos bsicos do R, por
exemplo, esto em uma biblioteca chamada base. Existem inmeras
bibliotecas, algumas j inclusas na instalao do R. No R podem-se encontrar
pacotes desenvolvidos pelos responsveis pelo R ou implementados por
usurios.
# instalando o pacote ExpDes (Experimental Designs)
#
install.packages("ExpDes")

# requerendo o ExpDes
require(ExpDes)

# sintaxe do comando que faz a ANOVA no ExpDes


# crd(treat, resp, quali = TRUE, mcomp = "tukey", sigT = 0.05, sigF = 0.05)
crd(trat,insulina,mcomp=F)
Resultados da anova pelo comando da pacote ExpDes
------------------------------------------------------------------------
Analysis of Variance Table
------------------------------------------------------------------------
DF SS MS Fc Pr>Fc
Treatament 2 10.2967 5.1483 9.3054 0.0064452
Residuals 9 4.9794 0.5533
Total 11 15.2760
------------------------------------------------------------------------
CV = 21.94 %
Podemos chegar a mesma concluso anteriormente, simplesmente analisando
o valor de p (Pr>Fc, (p=0,006445)), o qual bem menor que 0,01. Assim, sem
recorrer tabela F, conclumos que o teste F significativo pelo valor de p
(p=0,006445) fornecido pela funo crd() do ExpDes, rejeitamos H0 e
conclumos que a quantidade de insulina liberada diferente para pelo menos
dois nveis de glicose.
O R, por meio do comando aov( ) armazena os valores da tabela da
anova acima na forma matricial (2 x 5), ou seja, para obtermos, por exemplo, o
valor da soma de quadrados dos tratamentos (SQTr), definimos o seguinte
objeto
sqtr <- anova(insulina.av)[1,2].
A soma de quadrados do resduo obtida definindo o objeto
sqr <- anova(insulina.av)[2,2].
Reparem que insulina.av o objeto que recebeu os resultados do
quadro da anlise de varincia no script R listado anteriormente.
O esquema das posies de armazenamento dos resultados do quadro
da anova do DIC no R

Estatstica Experimental
46

Df Sum Sq Mean Sq F value Pr(>F)


trat [1,1] [1,2] [1,3] [1,4] [1,5]
Residuals [2,1] [2,2] [2,3]

Para obter o valor do quadrado mdio de resduo basta digitar e


executar o comando anova(insulina.av)[2,3]
Uma forma de se obter ajuda de alguma funo no R por meio da
execuo do comando ??nome da funo(). Por exemplo, para se obter uma
ajuda da sintaxe da funo mean deve-se executar o comando ??mean().
Informaes sobre o pacote ExpDes(), basta executar o comando ??ExpDes(),
e clicar nos passos indicados abaixo

ExpDes::ExpDes-package/
Index/
Documentation for package ExpDes version 1.1.2/ExpDes-package/
crd
Onde aparecer a explicao

crd(treat,resp,quali=TRUE,mcomp="tukey",sigT=0.05,sigF=0.05)

sendo:
treat Vetor numeric contendo os tratamentos;
resp Vetor numeric contendo a varivel resposta;
quali Logico. Se TRUE (default), os tratamentos so assumidos qualitativos, se
FALSE, quantitativos;
mcomp Permite a escolha do teste de comparao mltiplo; o default o teste de
Tukey, entretanto, as optes so: o teste LSD ('lsd'), o teste LSD com a
proteo de Bonferroni ('lsdb'), o teste de Duncan ('duncan'), o teste de
Student-Newman-Keuls ('snk'), o teste de Scott-Knott ('sk') e o teste de
comparao mltipla bootstrap ('ccboot');
sigT A significncia a ser usada para o teste de comparao mltipla; o default
5%;
sigF A significncia a ser usada no teste F da ANOVA; o default 5%,

os argumentos desta funo.

11 Exemplo 2
Em um experimento em que se mediu o peso corporal (kg), 19 porcos
foram distribudos aleatoriamente a 4 grupos. Cada grupo foi alimentado com
dietas diferentes. Deseja-se testar se oos pesos dos porcos so os mesmos
para as 4 dietas.
Desejamos testar a hiptese nula
H 0 : 1 2 3 4
H1 : i j para pelo menos um par i j
As observaes obtidas foram:
Tratamento Repeties
1 2 3 4 5
Dieta 1 60,8 57,7 65,0 58,6 61,7
Dieta 2 68,7 67,7 74,0 66,3 69,8
Dieta 3 102,6 102,1 100,2 96,5 *
Dieta 4 87,9 84,2 83,1 85,7 90,3

Estatstica Experimental
47

Temos um experimento desbalanceado com nmero de repeties


desigual para os tratamentos. Ento, os clculos para montarmos o quadro da
ANOVA so:
Graus de liberdade:
Total N 1 19 1 18;Trat. k 1 4 1 3
Re s N k 19 4 15
(1482,9 )2
CM 115736,44
19
SQT (60,8 )2 ... (90,3 )2 CM 120062,19 115736,44

4325,75
(303,8 )2 (346,5 )2 (401,4 )2 (431,2 )2
SQTr CM
5 5 4 5
119938,52 115736,44 4202,07
SQR SQT SQTr 4325,75 4202,07 123.67
4202,07 123,67
QMTr 1400,69 e QMR 8,24
3 15
QMTr 1400,69
Fc 169,89
QmR 8,24
O quadro da ANOVA para a varivel peso (kg) o seguinte:

Fonte de var. g.l. SQ QM Fc


Tratamentos 3 4202,07 1400,69 169,89
Resduo 15 123,67 8,24
TOTAL 18 4325,75

Script no R para resolver o exemplo 2


Ateno, antes de rodar este script necessrio remover todos os
objetos definidos no script do exemplo 1 com o comando
rm(list=ls(all=TRUE)), ou pelo atalho na aba do menu da janela da console
clicar em Misc/Remover todos os objetos

# exemplo 2 da Aula 3 (DIC) pg 46

# entrando com os dados de peso corporal


pc <- c( 60.8, 57.7, 65.0, 58.6, 61.7,
68.7, 67.7 , 74.0, 66.3, 69.8,
102.6, 102.1, 100.2, 96.5,
81.9, 84.2, 83.1, 85.7, 90.3)

# entrando com os nveis dos tratamentos


trat <- c(rep("Dieta1", 5), rep("Dieta2", 5), rep("Dieta3", 4), rep( "Dieta4",5))

# estabelecendo o objeto trat como fator e guardando no prprio objeto trat


trat <- factor(trat)
trat

# imprimindo os niveis do fator trat

Estatstica Experimental
48

n.trat<-levels(trat)
n.trat

# calcula a soma da cada tratamento e guarda em um objeto t.trat


t.trat <- tapply(pc, trat, sum)
t.trat

# calcula a mdia da cada tratamento e guarda em um objeto m.trat


m.trat <- tapply(pc, trat, mean)
m.trat
# calcula o desvio padro de cada tratamento e guarda em um objeto sd.trat
sd.trat <- tapply(pc, trat, sd)
sd.trat

# mostrando os grficos box plot para cada nivel de glicose na horizontal


boxplot(pc~trat, horizontal=T,xlab="Peso corporal (Kg)",col="blue")

# mostrando os grficos box plot para cada nivel de glicose na vertical


# boxplot(pc~trat, vertical=T,ylab="Peso corporal (Kg)",col="green")

# fazendo a anlise de varincia pela funo aov( )


pc.av <- aov(pc~trat)
summary(pc.av) # imprimindo o quadro da anova

Quadro da anova fornecido pelos comandos bsicos do R


Df Sum Sq Mean Sq F value Pr(>F)
trat 3 4202 1400.7 169.9 8.45e-12 ***
Residuals 15 124 8.2
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

O smbolo *** na frente do valor de p (p=8.45e-12) o cdigo de


significncia fornecido pelo R. No caso indica que o teste significativo para
um valor de muito pequeno em torno de 0,01%.
Obtendo o quadro da ANOVA pela funo crd( ) do pacote ExpDes
Ateno! Dado que o pacote ExpDes j foi instalado em seu computador, no
h necessidade de se instal-lo novamente, basta requer-lo pelos comandos
require(nome do pacote ) ou library(nome do pacote ).
# requrendo o pacote ExpDes
require(ExpDes)

# comando que faz a ANOVA no ExpDes


# crd( ) (completely random design)
crd(trat,pc,mcomp=F)

Quadro da anova fornecido pela funo crd( ) do pacote ExpDes

Estatstica Experimental
49

-------------------------------------------------------------------------------
Analysis of Variance Table
-------------------------------------------------------------------------------
DF SS MS Fc Pr>Fc
Treatament 3 4202.1 1400.69 169.88 8.4501e-12
Residuals 15 123.7 8.24
Total 18 4325.7
--------------------------------------------------------------------------------
CV = 3.68 %

A forma tradicional de interpretar o resultado do teste F da anova


consultar as tabelas das distribuies F. Desta consulta, temos que
F( 3 ,15 , 0 ,05 ) 3 ,287 e F( 3 ,15 , 0 ,01 ) 5 ,417 . O valor da estatstica Fc=169,89 bem
superior que estes valores tabelados, assim, o valor desta estatstica fornecida
pelos dados esta na regio de rejeio de H0 , logo rejeitamos a hiptese nula
H0 a um nvel 0 ,01, ou 1% de probabilidade (se significativo a 1%, logo
tambm significativo a 5%).
Ateno! Pode-se chegar a esta mesma concluso analisando somente
pelo valor de p associado estatstica F calculada, o qual apresentado na
forma exponecial p=8,45 e-12 ou p=8,45 x 10-12, bem menor que 0,001,
portanto significativo a 0,1%.
Graficamente a regra de deciso fica

Evidentemente que o valor 189,88 esta bem a direita do valor crtico


5,417, assim podemos concluir que, para um nvel de
0,001, ou 0, 01% , que os pesos dos porcos so diferentes para pelo
menos duas dietas.

12 Estimadores de mnimos quadrados.


Nesta seo mostraremos os estimadores dos termos do modelo
matemtico do DIC y ij i eij , os quais so obtidos minimizando-se a
expresso do erro deste modelo
k ri


i j
1
(y ij y ij ),
1
2

Estatstica Experimental
50

k
em relao a e i , i=1, 2, ...k, sujeito a restrio
i
ri i
1
0 . Assim

procedendo, obtemos os estimadores de , i e i , dados por


y , i y i y e de i i y i , i 1, 2,..., k .
Para construir um intervalo de confiana para a mdia de cada
tratamento, devemos notar que a estatstica:
y i i
~ t(n k ),
QMR
ri
i.., tem distribuio t Student com (n k) graus de liberdade. Um intervalo de
confiana para i com um coeficiente de confiana (1 ) dado pela
expresso
QM Re s
IC(i ; 1 )
yi t ,
( ;N k )
2 r

sendo, t o quantil de ordem (1
) da distribuio t Student com (n
(
2
, N k ) 2
k) graus de liberdade, os mesmos graus de liberdade do resduo da ANOVA.
Como exemplo, vamos considerar os dados do experimento
apresentado no item 1, cujos clculos foram mostrados no item 10. As mdias
destes dados so:
8,93 13,75 18,00
y 1 2,23 ; y 2 3,44; y 3 4,50 e
4 4 4 ;
y 3,39
do quadro da ANOVA temos os valores de SQR para calcular
QMR 0,553
0,372 ;
r 4
o valor de t(0,025, 9 ) 2,262 .
Assim, os intervalos so dados por:
0,553
IC(i ; 95%)
y i 2,262 y i 0,841
4
Resumindo temos o quadro a seguir
Nvel baixo Nvel mdio Nvel alto
de glicose de glicose de glicose
yi 2,23 3,44 4,50

IC( i , 95%) (1,389; 3,071) (2,599; 4,281) (3,659; 5,341)

Problema: identificar quais os nveis de glicose (tratamentos) que


tiveram efeitos no nulos sobre a liberao de insulina dos tecidos.
Script no R para o calculo dos intervalos de confiana do exemplo 1.
Ateno! necessrio executar novamente o script das pginas 39 e 40.

# definindo os objetos para o clculo dos ICs


# obteno dos gl do residuo no quadro da anova
glr <- anova(insulina.av)[2,1]
glr

Estatstica Experimental
51

# obteno da QMR no quadro da anova


qmr <- anova(insulina.av)[2,3]
qmr

# intervalo de confiana para o nvel baixo de glicose


ic.baixo <- m.trat[1] + qt(c(0.025, 0.975), df = glr) * sqrt(qmr/r)
ic.baixo

# intervalo de confiana para o nvel mdio de glicose


ic.medio <- m.trat[2] + qt(c(0.025, 0.975), df = glr) * sqrt(qmr/r)
ic.medio

# intervalo de confiana para o nvel baixo de glicose


ic.alto <- m.trat[3] + qt(c(0.025, 0.975), df = glr) * sqrt(qmr/r)
ic.alto

Como segundo exemplo, vamos considerar os dados do experimento


apresentado no item 11. As mdias destes dados so:
303,8 346,50 401,4
y 1 60,76 ; y 2 69,30; y 3 100,35;
5 5 4
431,2
e y 4 86,24 e a mdia geral y 79,13
5
do quadro da ANOVA temos o valor do QMR para calcular desvio
padro mdio para os tratamentos 1, 2 e 4
QMR 8,557
1,31. Para o terceiro tratamento o erro padro
ri 5
QMR 8,557
mdio 1,46
ri 4
o valor de t ( 0 ,025 ; 15 ) 2 ,1314 .
Assim, os intervalos so dados por:
8,557
IC(i ; 95%) y i 2,1314 y i 1,31, para i 1,2,e 4
5
8,557
e IC(i ; 95%)
y i 2,1314 y i 1,46, para i 3
4
Resumindo temos o quadro abaixo
Dieta 1 Dieta 2 Dieta 3 Dieta 4
yi 60,76 69,30 100,35 86,24

IC( i , 95%) (58,02; 63,48) (66,56; 72,04) (97,29; 103,41) (83,50; 88,98)
Problema: identificar quais as Dietas (tratamentos) que tiveram efeitos
no nulos sobre o peso dos sunos.

Script no R para calcular os ICs do exemplo 2. Antes porm execute


novamente o script do R descritos na pgina 40 e 42.

# definindo os objetos para o clculo dos ICs

Estatstica Experimental
52

# definindo o vetor de repeties dos tratamentos


r<- c(5,5,4,5)

# obteno dos gl do residuo no quadro da anova


glr <- anova(pc.av)[2,1]
glr

# obteno da QMR no quadro da anova


qmr <- anova(pc.av)[2,3]
qmr

# intervalo de confiana para a Dieta1


ic.dieta1 <- m.trat[1] + qt(c(0.025, 0.975), df = glr) * sqrt(qmr/r[1])
ic.dieta1

# intervalo de confiana para a Dieta2


ic.dieta2 <- m.trat[2] + qt(c(0.025, 0.975), df = glr) * sqrt(qmr/r[2])
ic.dieta2

# intervalo de confiana para a Dieta3


ic.dieta3 <- m.trat[3] + qt(c(0.025, 0.975), df = glr) * sqrt(qmr/r[3])
ic.dieta3

# intervalo de confiana para a Dieta4


ic.dieta4 <- m.trat[4] + qt(c(0.025, 0.975), df = glr) * sqrt(qmr/r[4])
ic.dieta4

13 Coeficientes de determinao (R2) e de variao (CV)


A parte da Soma de Quadrados Total (SQT), a variao total nas
observaes , que pode ser explicada pelo modelo matemtico do DIC,
denominada de coeficiente de determinao. Assim, o coeficiente de
determinao para modelo do DIC, y ij i eij , definido como
SQTr
R2 x 100% .
SQT
Pode ser verificado que 0 R 2 100 e que R 2 100% quando toda
variabilidade nas observaes esta sendo explicada pelo modelo matemtico
do DIC.
A variabilidade entre as unidades experimentais de experimentos
envolvendo diferentes unidades de medidas e/ou tamanhos de parcelas pode
ser comparada pelos coeficientes de variao, os quais expressam o desvio
padro por unidade experimental como uma porcentagem da mdia geral do
experimento, ou seja,
S
CV x 100% .
y
Da ANOVA sabemos que S QMR , da resulta que
QMR
CV * 100 .
y

Estatstica Experimental
53

Como exemplo vamos considerar os dados do experimento apresentado


no item 1, cujos clculos foram mostrados no item 10. Neste exemplo temos:
SQT 15,28 e SQTr 10,30,ento
2 SQTr 10,30
R x 100 67,4 %
SQT 15,28
QMR 0,55
CV * 100 * 100 21,88%
y 3,39
Conclumos que 67,4% da variabilidade que existe nas observaes
deste experimento em torno de seu valor mdio explicada pelo modelo
matemtico do DIC e este experimento apresenta um coeficiente de variao
de aproximadamente 22%.
Script no R para calcular os coeficientes de determinao (R2 ) e de
variao (CV)
# calculo do CV
cv <- sqrt(qmr)/mean(pc)*100
cv

sqtr <- anova(pc.av)[1,2] # obteno da SQTr da anova


sqtr
sqr <- anova(pc.av)[2,2] # obteno da SQR da anova
sqr

# clculo do R2
r2 <- sqtr/(sqtr+sqr)*100
r2

14 Checando as violaes das suposies de normalidade dos dados e


da homogeneidade das varincias dos tratamentos Anova
De um modo geral, o teste F da ANOVA no muito sensvel s
violaes da suposio de distribuio normal. Ele tambm moderadamente
insensvel s violaes de varincias iguais, se os tamanhos das amostras so
iguais e no muito pequenas em cada tratamento. Entretanto, varincias
desiguais podem ter um efeito marcante no nvel do teste, especialmente se
amostras pequenas esto associadas com tratamentos que tm as maiores
varincias. Existe uma srie de procedimentos para se testar se as suposies
da ANOVA so violadas. Entre estes temos o teste de Anderson-Darling, teste
de Shapiro-Wilks e teste de Kolmogorov-Smirnov, que testam a normalidade da
populao. A igualdade das varincias (homocedasticidade) pode ser testada
pelo teste de Bartlett. Com o advento dos modernos computadores, mtodos
grficos so ferramentas muito populares para a visualizao das violaes
das suposies tericas da ANOVA. Alguns destes mtodos grficos mais
comumente usados para checar as suposies da ANOVA so baseados em
grficos dos resduos.
Resduos. O resduo correspondente a uma observao y ij definido
como:
eij y ij y ij y ij i y ij y i ,
ou seja, o resduo corresponde parte da observao que no foi explicada
pelo modelo. Calculando os resduos correspondentes a todas as observaes
de um experimento e analisando-os descritivamente de forma apropriada,

Estatstica Experimental
54

podemos ter alguma indicao, graficamente, se as suposies da ANOVA


esto sendo satisfeitas.
Grfico dos resduos para testar a normalidade. Tcnicas grficas
para checar se uma amostra de resduos provenientes de uma populao
normal incluem os grficos do Histograma, do Box Plot, etc. Outra importante
tcnica o grfico q-q normal (quantile-quantile normal plot). O grfico q-q
normal, um grfico entre os resduos e um conjunto de percentis
devidamente escolhidos da normal padronizada. Sob a hiptese de
normalidade este grfico q-q normal deve se aproximar de uma reta. Se o
grfico sigmide uma indicao de que a populao tem as caudas
pesadas ou leves. A assimetria indicada por grficos cncavos (assimetria a
esquerda) e convexos (assimetria a direita).
O primeiro passo na construo de um grfico q-q normal o clculo de
n de resduos e ij
p ij , a qual denominada de probabilidade emprica
N 1
posto de e ij
acumulada, e est associada a todo e ij , de tal forma que p ij .
N 1
Como exemplo, a probabilidade emprica acumulada associada ao resduo,
cujo posto o sexto (seu rank=6) em um conjunto de N=10 resduos p=6/11
= 0.545. O grfico q-q normal de um conjunto de resduos obtido com o
grfico dos resduos e ij vs q ij z (1 p ij )
, sendo que: z o valor critico de
nvel de uma distribuio normal padronizada
Vamos considerar os dados apresentados no item 1 e construir um
grfico q-q normal para ver se a suposio de normalidade parece razovel
para a quantidade de insulina liberada do exemplo 1.
O Quadro abaixo apresenta os dados, o valor estimado pelo modelo, os
resduos e os percentis associados:
i j Yij Yest eij R(eij) Pij Qij
1 1 1.59 2.23 -0.64 1 0.077 -1.426
1 2 1.73 2.23 -0.50 5 0.385 -0.293
1 3 3.64 2.23 1.41 12 0.923 1.426
1 4 1.97 2.23 -0.26 6 0.462 -0.097
2 1 3.36 3.44 -0.08 7 0.538 0.097
2 2 4.01 3.44 0.57 10 0.769 0.736
2 3 3.49 3.44 0.05 8 0.615 0.293
2 4 2.89 3.44 -0.55 4 0.308 -0.502
3 1 3.92 4.50 -0.58 3 0.231 -0.736
3 2 4.82 4.50 0.32 9 0.692 0.502
3 3 3.87 4.50 -0.63 2 0.154 -1.020
3 4 5.39 4.50 0.89 11 0.846 1.020
e o grfico q-q normal ( eij x q ij ) fica sendo:

Estatstica Experimental
55

e os grficos do Histograma e do Box Plot dos resduos ficam:

Pelo grfico qq normal, pelo histograma e pelo Box-Plot razovel


supor a normalidade para os dados de liberao de insulina.
O script do R que fornece os resultados acima so:
# extraindo os resduos do objeto pc.av
residuo <-insulina.av$res
resduo

# fazendo o grfico q-q plot


qqnorm(residuo, ylab ="Resduos",main="Grfico normal de
probabilidade")
qqline(residuo,lwd=2)

# dividindo a tela grfica em 2 colunas e uma linha


par(mfrow=c(1,2))

# histograma dos resduos


hist(residuo, main="Histograma dos Resduos",lwd=2,col="green")

# grfico boxplot dos resduos


boxplot(residuo, horizontal=T,main="Boxplot dos resduos",
col="blue",lwd=2)
Estes recursos grficos no so quantitativos, necessrio um teste. O
script no R que fornece o teste de normalidade de Shapiro-Wilks , o qual testa
as hipteses:

Estatstica Experimental
56

H0 : a populao amostrada tem distruio normal


H1 : a populao amostrada no tem distruio normal
ou
H0 : eij ~ N (0, 2 )
H1 : eij no tem N (0, 2 )
dado a seguir

# teste de normalidade de Shapiro-Wilks dos dados do exemplo 1


shapiro.test(residuo)

Cujos resultados so:

Shapiro-Wilk normality test

data: res
W = 0.8796, p-value = 0.08657.
No resultado fornecido pelo R e pelo valor de p (p=0,08657) associado a
estatstica W=0,8796 do teste de Shapiro-Wilks, no rejeitamos H 0 , logo
razovel supor a normalidade para os dados de liberao de insulina. O teste
de Bartlett testa as hipteses
H 0 : 12 22 32
,
H1 : i2 2j i j
ou seja, a homogeneidade das varincias dos tratamentos.
O script no R que fornece este teste

# teste de homogeneidade das varincias dos tratamentos dos dados do


#exemplo 1 (Teste de Bartlett)

# teste de Bartlett para a homogeneidade das varincias


bartlett.test(insulina ~ trat)

com a seguinte sada

Bartlett test of homogeneity of variances

data: insulina by trat


Bartlett's K-squared = 1.27, df = 2, p-value = 0.5299

Pelos resultados destes testes no rejeitamos H 0 , o nvel mnimo de


significncia do teste p=0,5299 (p>0,05). O teste no significativo.
Conclumos, ento, que a homogeneidade das varincias uma suposio
plausvel para os dados da liberao da insulina. Assim razovel supor que
este conjunto de dados suporta as suposies bsicas de normalidade e
homogeneidade da varincia para a correta aplicao da ANOVA.

Estatstica Experimental
57

14 Vantagens e desvantagens do DIC


As principais vantagens do DIC so:
fcil de ser planejado e flexvel quanto ao nmero de
tratamento e de repeties tendo como nica limitao o nmero
de unidades experimentais disponveis para o experimento;
o nmero de repeties pode variar de tratamento para tratamento,
embora o desejvel ter o mesmo nmero de unidades
experimentais em todos os tratamentos;
o DIC proporciona o nmero mximo de graus de liberdade para o
resduo;
a anlise estatstica simples mesmo que se perca algumas
unidades experimentais.

Algumas desvantagens so:


mais apropriado para um pequeno nmero de tratamentos e para
um material experimental homogneo;
todas as fontes de variao no associadas aos tratamentos faro
parte do resduo, podendo comprometer a preciso das anlises;
super-estima a varincia residual.

15 Resumo
O DIC mais til onde no existe nenhuma fonte de variao
identificvel entre as unidades experimentais, exceto s dos efeitos dos
tratamentos. o mais flexvel com respeito ao arranjo fsico das unidades
experimentais. Ele maximiza os graus de liberdade para a estimao da
varincia por unidade experimental (erro experimental ou erro residual) e
minimiza o valor da estatstica F requerida para a significncia estatstica.

Estatstica Experimental
58

3 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL


1- Para avaliar o efeito de altos nveis de cobre na alimentao de pintinhos, seis
pintinhos foram alimentados com uma dieta basal padro s quais foram
adicionadas trs nveis de cobre (0, 400, e 800 ppm). Os dados abaixo mostram
a razo da eficincia da dieta (g dieta/ g ganho de peso) ao final de 3 semanas
Use o R para apresentar os resultados.
Tratamentos Pintinhos
(nvel de cobre) 1 2 3 4 5 6
0 1,57 1,54 1,65 1,57 1,59 1,58
400 1,91 1,71 1,55 1,67 1,64 1,67
800 1,88 1,62 1,75 1,97 1,78 2,20
(extrado de Statistical Research Methods in the Life Science, P. V. Rao, pg. 287).
(a) Calcular os totais dos tratamentos yi+ , i=1,2,3, as mdias dos tratamentos
yi , os desvios padres dos tratamentos si , i=1,2,3, o total geral y++, e a mdia
geral y .

(b) Estabelecer as hipteses estatsticas H0 e H1 e as suposies bsicas para


se testar estas hipteses.

(c) Monte o quadro da anova

Estatstica Experimental
59

(d) Com base nos resultados do teste F da anova faa as concluses pertinentes
sobre as hipteses do item (b).

(e) Calcular os intervalos de confiana das mdias dos tratamentos IC(i ; 95%).
Apresente os resultados. (Siga o modelo tabela pg 42 da apostila).

(f) Calcular os coeficientes: de determinao R2 e o de variao do experimento


(CV). Comente os resultados.

Estatstica Experimental
60

(g) Verifique as suposies bsicas da ANOVA. Apresente e comente os resultados.

2- Num experimento inteiramente casualizado com 5 tratamentos e 4 repeties, estudou-se o


efeito de 5 carrapaticidas (tratamentos) no controle de carrapatos em bovinos.
Analisando- se o nmero de carrapatos que cairam por animal, obtiveram-se as
seguintes somas de quadrados:
S.Q. Tratamentos = 41,08
S.Q. Total = 57,46
Estabelecer as hipteses estatsticas H0 e H1, montar o quadro de anlise de varincia, concluir
e calcular o coeficiente de determinao R2

3- Cite as vantagens e as desvantagens do delineamento inteiramente casualizado.


4- Escreva o modelo matemtico do delineamento inteiramente casualizado para os dados
apresentados na 2 questo.
5- Descreva os procedimentos de um experimento cego, e dos experimentos duplamente
cego.
6- Quando um experimento ser considerado planejado (Descreva as etapas).
7- Quais os princpios bsicos da experimentao.

Estatstica Experimental
61

Aula 4 Teste de comparaes mltiplas


1 Introduo
Os testes de comparaes mltiplas tambm conhecidos como testes de
comparaes de mdias servem como um complemento ao teste F da anlise
de varincia quando este significativo e so usados para detectar diferena
entre mdias. Considere o exemplo a seguir

Exemplo 1. Em um experimento de alimentao de porcos, foram


utilizados quatro raes (A, B, C e D), cada uma fornecida a 5 animais. Os
ganhos de peso, kg, foram:
Raes
A B C D
35 40 39 27
19 35 27 12
31 46 20 13
15 41 29 28
30 33 45 30
Calculando-se as somas de quadrados podemos construir o seguinte
quadro de anlise de varincia:
F.V. g.l. S.Q. QM Fc
Raes 3 823,75 274,58 3,99
Resduo 16 1100,00 68,75

Total 19 1923,75

Das tabelas das distribuies F, temos que


F( 3 ,16 , 0 ,05 ) 3 ,24 e F( 3 ,16 , 0 ,01 ) 5 ,29 . O valor Fc=3,99 maior que
o valor do F tabelado a 5%, ento, rejeitamos a hiptese nula H0 a
5% de probabilidade.
Dvida: Qual a rao que tem o melhor desempenho no ganho
de peso?
Para responder a questo, conheceremos alguns PROCEDIMENTOS
DE COMPARAES DE MLTIPLAS ou MTODOS DE COMPARAES
DE MDIAS, como por exemplo, os testes t-Student , Scheff, Tukey, Duncan,
Dunnett e Bonferroni, dentre outros.

2 Definies bsicas
Consideremos um experimento com k tratamentos, cujas mdias
populacionais so 1 , 2 ,..., K e seus estimadores y 1 , y 2 ,..., y k foram obtidas
de amostras de tamanhos r1, r2, ..., rK.

Definio 1 Um contraste de mdias qualquer funo do tipo


Y c11 c 2 2 ... c k k ,
k
com
i
1
ci c 1 c 2 ... c k 0 e i , a mdia do tratamento i = 1, 2, ..., k

Estatstica Experimental
62

k
a i bi
Definio 2 Dizemos que dois contrastes so ortogonais se
i1 r i
0

. Quando o experimento balanceado (ri = r) a condio de ortogonalidade


k
que a soma dos produtos de seus coeficientes nula, i..,
i
a i bi
1
0.

Quando um experimento envolve k tratamentos, podemos definir


diversas comparaes entre as k mdias, mas somente (k 1) so
ortogonais;
k(k 1)
Nos contrastes envolvendo duas mdias podemos definir
2
contrastes possveis, os quais no so ortogonais.

Supondo que os tratamentos tm varincia constante 2 e que uma


estimativa no viesada desta varincia o QMR da ANOVA, tem-se que:
Y c 1x 1 c 2 x 2 c 3 x 3 c n x k um estimador no viesado do
contraste Y c11 c 2 2 ... c k k ;
2
2
n
2
V(Y )(c 1 c 2 c n )
2 2

ri
i 1
ci 2

ri
e um estimador no

QMR
Y )(c 2 c 2 c 2 )
n
QMR
viesado dado por V( 1 2 n
ri

i 1
c i2
ri
,

se o experimento balanceado r1= r2 = ...= rK =r, as expresses


acima ficam, respectivamente,
2 n
2
V(Y )(c 12 c 22 c n2 ) c i2 e
r i 1 r
Y )(c 2 c 2 c 2 ) QMR n
QMR
V( 1 2 n c i2
r i 1 r
Exemplo 1. Em um experimento dois antibiticos em duas dosagens cada um
para a cura da mastite em bovinos. A varivel resposta tempo de cura em
dias
Tratamento Descrio
T1 Dose baixa da droga A
T2 Dose alta da droga A
T3 Dose baixa da droga B
T4 Dose alta da droga B
Podemos definir os seguintes contrastes:
Y1 1 2 3 4 : compara as doses da droga A com as doses
da droga B;
Y 2 1 2 : compara as doses da droga A;
Y3 3 4 : compara as doses da droga B.
A afirmao de que o contraste Y1 nulo (Y1 = 0) o mesmo que afirmar
2 3 4
que: 1 2 3 4 , ou que, 1 , ou ainda, que a mdia dos
2 2
tratamentos 1 e 2 igual mdia dos tratamentos 3 e 4.

Estatstica Experimental
63

Para verificarmos se estes contrastes so ortogonais aconselhvel


uma tabela com os coeficientes dos (k 1) contrastes e a partir da, verificar
que a soma dos produtos dos coeficientes, aos pares, nula.

Contraste 1 2 3 4
Y1 +1 +1 -1
-1

Y2 +1 -1 0 0

Y3 0 0 +1 -1

Portanto estes contrastes so ortogonais 2 a dois e ortogonais entre si.

3 Teste t - student O teste t student pode ser utilizado para comparar


mdias de tratamentos. Os requisitos bsicos para sua utilizao so:
as comparaes devem ser determinadas a priori, ou seja, antes
de serem examinados os dados.
no existe limite para o nmero de contrastes envolvendo as
mdias de tratamentos, porm, o nmero de contrastes ortogonais
, no mximo, igual ao nmero de graus de liberdade dos
tratamentos.
A ortogonalidade entre os contrastes de mdias garante
independncia entre as concluses.
O objetivo testar a hiptese
H 0 :Y i 0
,
H 1 :Y i 0
Yi Yi
Usamos a estatstica t ~ t(gl res , ), a qual sob H0
Y ) QMR k 2
V(
c
r i 1 i
verdadeira tem distribuio t-student com o mesmo nmero de graus de
liberdade do resduo, no DIC ( n-k ). Para um valor fixado de nvel de
significncia , devemos buscar o valor de t tabelado (arquivo Tab_tstudent,
disponibilizado na pgina ou nos livros indicados na bibliografia) e compar-lo
com o valor da estatstica tc , calculada para o contraste Yi e aplicar a regra de
deciso:
Se t c tTabelado rejeitamos H0 para um determinado valor de ,
geralmente 5% ou 1%, caso contrrio ( t c tTabelado ), no rejeitamos
H0.
(veja o esquema grfico desta regra de deciso apresentado no item 6
da 2 Aula).

Exemplo 2: Num experimento inteiramente casualizado com 4 tratamentos e 4


repeties, estudaram-se os efeitos de Bacitracina de zinco(BDZ) e Anti-stress
sobre frangos de corte alimentados com raes base de sorgo, desde a fase
inicial at a final. A resposta medida foi converso alimentar. Foram utilizados
os seguintes tratamentos:

Tratamento Descrio Mdia(kg)


1 Concentrado Comercial + Milho 2,03
2 Concentrado Comercial + Sorgo 2,24

Estatstica Experimental
64

3 Concentrado Comercial + Sorgo + BDZ 2,04


4 Concentrado Comercial + Sorgo + Anti-stress 2,22
Sabendo-se que da ANOVA o valor do QMR 0 ,0044375 , com 12
graus de liberdade. Pode - se estabelecer os contrastes de mdias dos
tratamentos para cada componente do desdobramento:
Milho vs. sorgos, o qual expresso pela combinao linear
Y1 3 1 2 3 4 , estimado por Y1 3 y1 y 2 y 3 y 4 ;
Sorgo vs. Sorgo + Aditivos, o qual expresso pela combinao
linear Y2 2 2 3 4 , estimado por Y2 2 y 2 y 3 y 4 ;
Bacitracina vs. Anti-stress, o qual expresso por
Y3 3 4 , etimado por Y3 y 3 y 4 ;
A verificao se os contrastes so ortogonais pode ser feita facilmente
no quadro abaixo:

Contraste 1 2 3 4 4
tc
YI
c
I 1
2
i

Y1 +3 -1 -1 -1 -0,41 12 -3,55 (p=0,00198)

Y2 0 +2 -1 -1 0,22 6 2,70 (p=0,0097)

Y3 0 0 +1 -1 -0,18 2 -3,82 (p=0,0012)


p< 0,01 significativo a 1% e a 5%; p< 0,05 significativo a 5% e p> 0,05 no-significativo a 5%.
H 0 :Y i 0
O objetivo testar a hiptese , para i = 1,2,3.
H 1 :Y i 0
Assim, para o contraste Y1 , temos que:
H 0 :Y1 0

H 1 :Y1 0
Y1 3(2,03 )
(2,24 )
(2,04 )(2,22 ) 0,41 e
QMR 4 2 0,0044375
Y1 )
V( ci 12 0,0133
r i 1 4
Y1 0,41
tc 3,55
QMR 4 2 0,0133
c
r i 1 i
t(12, 0,025 ) 2,179 . Como t c tTab , ento rejeitamos H0
(0,005<p<0,001). (Repetir estes passos para os contrastes Y2 e Y3 ).
Script do R para o clculo dos resultados apresentados acima

# como no foram fornecidos os dados deste exemplo


# necessrio fornecer os valores
# definindo o nmero de repeties
r <- 4

# definindo os graus de liberdade do resduo


glr <- 12

# quadrado mdio do resduo

Estatstica Experimental
65

qmr <- 0.0044375

# definindo as mdias dos tratamentos


m.trat <- c( 2.03, 2.24, 2.04, 2.22)

# definindo os coeficientes do contraste


c <- c( 3, -1,-1,-1)

#calculo da varincia do contraste


var.c<- qmr/r*sum(c1^2)

# clculo da estatstica tc da estatstica t-student


tc <- sum(c*m.trat)/sqrt(qmr/r*sum(c^2))
tc

# clculo do valor de p associado estatistica t calculada anteriormente


valor.p<- 1-pt(abs(tc),glr)
valor.p
(repita este procedimento adaptando-o aos demais contrastes)

Com base nos resultados dos testes de hipteses, conclumos que:


os animais tratados com o concentrado comercial + milho tm uma
converso alimentar melhor do que os animais tratados com
concentrado comercial + sorgo;
os animais tratados com o concentrado comercial + sorgo+aditivos
tm uma converso alimentar melhor do que os animais tratados
com concentrado comercial + sorgo, ou seja, os aditivos BDZ e
anti-stress quando adicionados ao concentrado comercial no
melhoram a converso alimentar;
os animais tratados com o concentrado comercial + sorgo+BDZ tm
uma converso alimentar melhor do que os animais tratados com
concentrado comercial + sorgo+anti-stress.

4 Teste de Scheff
O teste de Scheff pode testar qualquer contraste envolvendo
mdias de tratamentos do tipo Y c1 1 c 2 2 ... c k k definido a priori ou
no, sendo baseado na estatstica S, definida como:
ri r para todo i (Experimento balanceado) ri r j para i j (Experimento desbalanceado)
S (k 1) Y )
F(k 1, gl res , )V( k
c i2
F(k 1, gl res , )QMR
i
S (k 1) ;
c i2 i 1 ri
k
F(k 1, gl res , )QMR
(k 1) ;
i 1 r

Sendo: k 1 o nmero de graus de liberdade de tratamentos;


F( k 1, gl res, ) o valor crtico da Tabela F-Snedecor, a qual depende dos graus de
liberdade de tratamentos e do resduo; ci so os coeficientes do contraste e ri
o nmero de repeties do i-simo tratamento. A Regra de Deciso do teste de
Scheff para rejeitarmos ou no se o contraste diferente de zero comparar
a estimativa do contraste Y com o valor de S:

Estatstica Experimental
66

se Yi S , rejeitamos a hiptese H0 : Yi 0 , e conclumos que o


contraste de mdias diferente de zero;
se Yi S , no rejeitamos a hiptese H0 : Yi 0 , e conclumos que
o contraste de mdias no diferente de zero
Aplicando o teste de Scheff ao exemplo anterior do teste de t-student,
temos

Contraste 1 2 3 4 4 S
YI

I
ci
1
2

Y1 +3 -1 -1 -1 -0,41 12 0,3733 *

Y2 0 +2 -1 -1 0,22 6 0,2640 *

Y3 0 0 +1 -1 -0,18 2 0,1524 ns
* significativo a 5%; ns no significativo a 5%.
H 0 :Y i 0
O objetivo testar a hiptese , para i = 1,2,3.
H 1 :Y i 0
Assim, para o contraste Y1 , temos que:
H 0 :Y1 0

H 1 :Y1 0
Y1 3(2,03 )
(2,24 )
(2,04 )(2,22 ) 0,41 e
QMR 4
0,0044375
Y1 )
V( ci 2
12 0,0133
r i1 4
0,0044375
S (4 1)
F(3,12, 0,05 ) 2
((3 ) 12 12 12 )
4

0,0044375
(4 1)(3,49 )( )(12 ) 0,1394 0,3733
4
Pela regra de deciso Yi S , logo rejeitamos H0 a 5% de
probabilidade e conclumos que a rao comercial com milho tem
uma converso alimentar melhor do que a que a rao comercial
com sorgo.
O script no R para o clculo da estatstica de Scheff

# como no foram fornecidos os dados deste exemplo


# necessrio fornecer os valores
# definindo o nmero de repeties
r <- 4

# definindo os graus de liberdade dos tratamentos


gltr<- 3
# definindo os graus de liberdade do resduo
glr <- 12

# quadrado mdio do resduo


qmr <- 0.0044375

# definindo as mdias dos tratamentos

Estatstica Experimental
67

m.trat <- c( 2.03, 2.24, 2.04, 2.22)

# definindo os coeficientes do contraste


c <- c( 3, -1,-1,-1)

# clculo da varincia do contraste


var.c<- qmr/r*sum(c1^2)

# clculo da estatstica S de Scheff


s<- sqrt(gltr*q(0.95,gltr,glr)*var.c)
s
(Repetir esse procedimento para os contrastes Y2 e Y3 e tirar as concluses).

5 Teste de Tukey
O Teste de Tukey baseado na amplitude total estudentizada
(studentized range) e pode ser usado para comparar todo contraste entre duas
mdias de tratamentos do tipo
H 0 :Yi i j 0 para i j
Hipteses:
H 1 :Yi i j 0
Calcular o valor da diferena mnima significativa (d.m.s):

ri r para todo i (Experimento ri r j para i j (Experimento desbalanceado)

QMR 1 1
balanceado)

QMR dms q(k ; gl ( )


dms q(k ; gl res , )
res , )
2 ri r j
r

sendo: q( k , gl res , ) o valor da amplitude total estudentizada e obtido


de tabela prpria, e depende do nmero de tratamentos (k) e do nmero de
graus de liberdade para o resduo, o qual neste exemplo (n - k). Aps calcular
o d.m.s., calculamos a estimativa dos contrastes entre os pares de mdias
Y i x i x j e comparamos esses valores com o valor do d.m.s., aplicando a
seguinte regra de deciso:
se Y i d .m.s. rejeitamos H0, ao nvel a de significncia, e
conclumos que as mdias dos tratamentos envolvidos so
diferentes;
se Y i d .m.s. no rejeitamos H0 e conclumos que as mdias dos
tratamentos envolvidos so iguais.

Exemplo 3: usaremos os dados do exemplo 1 apresentado no incio desta


aula, o quadro da anova fornece

k = 4, QMR 68,75 com 16 graus de liberdade e q(5, 16,0,05 ) 4,046


QMR 68,75
e dms q(k ; n k , ) 4,046 15,00
r 5
Assim, toda estimativa de contraste do tipo Yi y i y j que exceder o
valor do d.m.s.= 15,00 significativo a 5%.

Estatstica Experimental
68

Estimativa do contraste

Y1 y B y A 39 26 13 ns

Y2 yC y A 32 26 6 ns
Y3 y D y A 22 26 4 ns

Y4 y B yC 39 32 7 ns

Y5 y B y D 39 22 17 *

Y6 yC y D 32 22 10 ns
* - significativo a 5%; ns no significativo a 5%
Script no R para o clculo da anova e o teste de Tukey
# entrando com os dados de ganho de peso
gp <- c(35,19,31,15,30,
40,35,46,41,33,
39,27,20,29,45,
27,12,13,28,30)

# entrando com o nmero de repeties dos tratamentos


r <- 5

# entrando com os nveis dos tratamentos


trat <- c(rep("A",r),rep("B",r),rep("C",r),rep("D",r))
trat

# clculo das medias dos tratamentos


m.trat <- tapply(gp,trat,mean)
m.trat

# Grfico Box-Plot
boxplot(gp~trat, vertical=T,ylab="ganho de peso",col="green")

# anlise da varincia - ANOVA


gp.av <- aov(gp~factor(trat))
summary(gp.av)

# obtendo os residuos
residuo <- aov(gp.av)$res
residuo

# gerando o grfico normal de probabilidade


qqnorm(residuo,ylab="Residuos", main=NULL,pch=16,col=2)

# colocando a reta da distribuio terica normal


qqline(resduo,lwd=2,main="Grfico Normal de Probabilidade dos
Resduos")

# testando a normalidade dos resduos "Teste de Shapiro-Wilks"


shapiro.test(residuo)

Estatstica Experimental
69

# teste da homogeneidade das varincias "Teste de Bartllet"


bartlett.test(gp ~ trat)

# Teste de Tukey
compara.tu <- TukeyHSD(gp.av)
compara.tu

# grafico do teste de Tukey


plot(compara.tu,main="Teste de Tukey")

Sada proporcionada por este script

Mdia dos tratamentos


A B C D
26 39 32 22
grfico box-plot para cada tratamento
45
40
35
ganho de peso

30
25
20
15

A B C D

Quadro da anova fornecido pela funo aov( )


Df Sum Sq Mean Sq F value Pr(>F)
trat 3 823.7 274.58 3.994 0.0267 *
Residuals 16 1100.0 68.75
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Concluso: o teste F significativo (p=0,0267), rejeitamos H0. Assim existe
pelo menos dois tratamentos que diferem entre si.
Grfico da normalidade
10
5
Residuos

0
-5
-10

-2 -1 0 1 2

Quantis tericos

teste de Shapiro-Wilks de normalidade


Shapiro-Wilk normality test
data: residuo

Estatstica Experimental
70

W = 0.9387, p-value = 0.227


Concluso: o teste no significativo (p=0,227), no rejeitamos H0 e
conclumos que os dados deste experimento suportam a suposio de
normalidade.

Teste de Bartlett da homogeneidade das varincias populacionais dos


tratamentos

Bartlett test of homogeneity of variances


data: gp by trat
Bartlett's K-squared = 1.5284, df = 3, p-value = 0.6757

Concluso: o teste no significativo (p=0,6757), no rejeitamos H0 e


conclumos que os dados deste experimento suportam a suposio de
homogeneidade das varincias populacionais dos tratamentos.
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = gp ~ trat)
$trat
diff lwr upr p adj
B-A 13 -2.003315 28.003315 0.1018285
C-A 6 -9.003315 21.003315 0.6687032
D-A -4 -19.003315 11.003315 0.8698923
C-B -7 -22.003315 8.003315 0.5553529
D-B -17 -32.003315 -1.996685 0.0237354
D-C -10 -25.003315 5.003315 0.2640642

Concluso: o teste de Tukey significativo (p=0,0237) para o contraste entre


as mdias dos tratamentos D e B. Os outras comparaes de pares de mdias
populacionais dos tratamentos no so significativas.
Uma forma simples de apresentao destes resultados a seguinte:
coloque as mdias em ordem decrescente;
una as mdias que no diferem entre si por meio de uma linha
No exemplo temos:
yD yA yC yB *
22 26 32 39

* mdias seguidas pela mesma linha no diferem entre si pelo teste de Tukey a 5% de probabilidade .

Outra forma, muito utilizada pelos pesquisadores a que substitui a


linha por letras, ou seja,
yD yA yC yB
22a 26ab 32ab 39b,
mdias seguidas pela mesma letra minscula no diferem entre si pelo teste de Tukey a 5% de probabilidade

ou ainda,
Tratamentos Mdias
D 22 a
A 26 ab
C 32 ab
B 39 b
mdias seguidas pela mesma letra minscula nas colunas no
diferem entre si pelo teste de Tukey a 5% de probabilidade.

A sada do pacote ExpDes para o teste de Tukey j contempla esta


facilidade das mdias seguidas pelas letras.
O script do R usando os recursos deste pacote dado por:

Estatstica Experimental
71

# usando ao funo crd( ) do ExpDes


# requerendo o ExpDes
library(ExpDes)
crd(trat,gp,quali=T,mcomp="tukey")

a sada fornecida por este script :


------------------------------------------------------------------------
Analysis of Variance Table
------------------------------------------------------------------------
DF SS MS Fc Pr>Fc
Treatament 3 823.75 274.58 3.9939 0.026711
Residuals 16 1100.00 68.75
Total 19 1923.75
------------------------------------------------------------------------
CV = 27.87 %
------------------------------------------------------------------------
Shapiro-Wilk normality test
p-value: 0.2270063
According to Shapiro-Wilk normality test at 5% of significance, residuals can be considered
normal.
------------------------------------------------------------------------
Tukey's test
------------------------------------------------------------------------
Groups Treatments Means
a B 39
ab C 32
ab A 26
b D 22
------------------------------------------------------------------------

6 Teste de Dunnet
um teste utilizado no qual as nicas comparaes de interesse so
aquelas entre os tratamentos e um determinado tratamento padro, geralmente
a testemunha (controle), e cada um dos demais tratamentos, no havendo
interesse na comparao dos demais tratamentos entre si. Para testarmos o
contraste H0 : i c , o qual envolve a mdia do tratamento i e do
tratamento controle c, usamos a estatstica:
1 1
D d(k , gl res , )( )QMR ,
ri rc
sendo: d( k , gl res , ) o valor tabelado para fixado freqentemente em 5%, que
depende do nmero total de tratamentos (k), do nmero de graus de liberdade
do resduo (gl res), o qual neste exemplo (n-k) e de ; ri e rc correspondem
ao nmero de repeties dos tratamentos i e c. A seguir, calculamos uma
estimativa para cada um dos contrastes Yi y i y c e comparamos o valor da
estatstica D' e aplicamos a seguinte regra de deciso:
se Yi D rejeitamos H0 e conclumos que a mdia do tratamento
i difere significativamente da mdia do tratamento c o padro;
se Yi D no rejeitamos H0 e conclumos que a mdia do
tratamento i igual ao do tratamento padro c.
Como exemplo, considere as mdias de um experimento, apresentados
na tabela abaixo, em que um mdico veterinrio, comparou o efeito de cinco

Estatstica Experimental
72

drogas na diminuio da presso arterial de animais experimentais. Para tanto


o pesquisador tomou 30 animais e dividiu ao acaso em seis grupos: o grupo
controle recebeu um placebo e os outros receberam, cada um, uma das
drogas.
Mdias
Tratamentos
(Drogas)
A 21 a
B 8 b
C 10 b
D 29 a
E 13 a
Controle 2 b
Mdias com a mesma letra do controle nao diferem deste pelo teste de Dunnett a 5% de probabilidade.

A verificao destes resultados pode ser feita por meio dos resultados
da ANOVA, onde QMR= 36, os graus de liberdade do resduo 24 e vamos
fixar 5% .
Procedimentos:
consultando a Tabela do Teste de Dunnett (VIEIRA, S. pg 183 e
184) a 5% de probabilidade, temos que d ( 6 , 24 , 0 ,05 ) 2 ,76 e a
2(36 )
estatstica D 2,76 10,47
5
fcil verificar que as drogas A, D e E diferem significativamente
do controle, ou seja, apresentam resultados melhores que os do
controle.
O teste de Dunnett no R est implementado no pacote multcomp. Um
exemplo de sua utilizao para os dados do exemplo 1 desta aula,
considerando o tratamento A como controle, dado pelo script abaixo

# instalando o pacote multicomp


install.packages("multcomp")

# requerendo o pacote multcomp


require(multcomp)

# teste de Dunnett
gp.dunnett <- glht(gp.av, linfct = mcp(trat = "Dunnett"))
summary(gp.dunnett)

A sada fornecida por este script :


Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Dunnett Contrasts

Fit: aov(formula = gp ~ trat)


Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
B - A == 0 13.000 5.244 2.479 0.062
C - A == 0 6.000 5.244 1.144 0.540
D - A == 0 -4.000 5.244 -0.763 0.788
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Estatstica Experimental
73

(Adjusted p values reported -- single-step method)


Concluso: todos os valores de p do teste t-student so superiores a 0,05 (p >
0,05) logo nenhum dos tratamentos B, C e D diferem do controle A.

7 Teste de Duncan
A aplicao do teste de Duncan bem mais trabalhosa que o teste de
Tukey, mas chega-se a resultados mais detalhados e se discrimina com mais
facilidade entre os tratamentos. Geralmente, o Teste de Duncan indica
resultados significativos em casos em que o Teste de Tukey no permite obter
significncia estatstica. Para a aplicao do teste importante ordenarmos as
mdias dos tratamentos em ordem crescente ou decrescente de tamanho. A
seguir, calculamos o valor da amplitude total mnima significativa (shortest
significant range) para o contraste entre a maior e a menor das mdias dos
tratamentos, usando a frmula:
QMR
d .m .s . z(p , gl res , ) ,
r
sendo: p=i-j+1 ( n de mdias abrangidas pelo intervalo delimitado pelas
mdias comparadas), z( p, gl res , ) o nvel da amplitude mnima estudentizada
de Duncan (obtido da Tabela de Duncan arquivo Tab_Duncan_5%.pdf), neste
exemplo os graus de liberdade do resduo n-k.
A regra de deciso :
se Yi d .m .s . rejeita-se H0 , ou seja, se o valor absoluto da
diferena entre as mdias em comparao igual ou maior que a
d.m.s.
se Yi d .m .s . no rejeitamos H0
Considere os dados do item 6 desta aula. A ordem dos tratamentos,
segundo a grandeza das mdias, :

Tratamentos Controle B C E A D
Mdias (2) (8) (10) (13) (21) (29)

O valor do d.m.s. para comparar a mdia do Controle com a mdia da


Droga D :
36
d .m .s . 3,276 8,79 ,
5
Sendo que o valor de p = 6-1+1 = 6, o valor dos graus de liberdade
neste exemplo n-k=24 e 5% Da que o valor Tabelado
z( 6 , 24 , 0 ,05 ) 3 ,276 . O valor Y1 y Cont y D 2 29 27 27 , o que pela
regra de deciso nos leva a rejeitar a H0 : Y1 0 e conclumos que a mdia da
Droga D significativamente maior que a mdia do controle, a 5% de
probabilidade. As comparaes entre o controle e a Droga A, e entre as Drogas
B e D, envolvem intervalos de cinco mdias e o calculo do d.m.s. do teste de
Duncan fica:

os contrastes so Y2 Cont A e Y3 B D e seus valores de


suas estimativas em mdulo so

Estatstica Experimental
74

Y2 2 21 19 e Y 3 8 29 21 e o valor da
36
d .m .s . 3,226 8,66 . Neste caso z(5, 24, 0,05 ) 3,226 ,
5
portanto, rejeitamos as hipteses
H 0 :Y2 Cont A 0 e H 0 :Y3 B D 0 e conclumos que
estes contrastes so significativos a 5% de probabilidade.

Da mesma forma para comparar o controle e a Droga E, as Drogas B e


A, e as Drogas C e D, todas elas envolvendo quatro mdias, temos,

os contrastes Y 4 Cont E , Y5 B A e Y6 C D e seus


valores de suas estimativas em mdulo so
Y4 2 13 11, Y5 8 21 13 e Y6 10 29 19 e o valor da
36
d .m .s . 3,160 8,48 . Neste caso z(4, 24, 0,05 ) 3,160 .
5
Portanto rejeitamos as hipteses
H 0 :Y 4 Cont E 0; H 0 :Y5 B D 0 e H 0 :Y6 C D 0
e conclumos que estes contrastes so significativos a 5% de
probabilidade.
Este mesmo procedimento pode ser feito para comparar mdias de
tratamentos correspondendo a intervalos que abrangem trs mdias, sendo
que neste caso, z(3, 24, 0,05 ) 3,066 e duas a duas com z( 2 , 24 , 0 ,05 ) 2 ,919 . (ver
detalhes destes clculos no livro da Vieira, S. Estatstica experimental
p. 66).
O resultado da aplicao do teste de Duncan representado da seguinte
maneira:

Tratamentos Controle B C E A D
mdias (2)a (8)ab (10)ab (13)b (21)c (29)d
Mdias seguidas pela mesma letra minscula no diferem entre si pelo teste de Duncan a 5% de
probabilidade.

# usando ao funo crd( ) do ExpDes


# requerendo o ExpDes (ateno !!! se o ExpDes j foi requerido no
# necessrio requer-lo novamente
library(ExpDes) #
crd(trat,gp,quali=T,mcomp="duncan")

A sada fornecida por este script


Analysis of Variance Table
------------------------------------------------------------------------
DF SS MS Fc Pr>Fc
Treatament 3 823.75 274.58 3.9939 0.026711
Residuals 16 1100.00 68.75
Total 19 1923.75
------------------------------------------------------------------------
CV = 27.87 %
------------------------------------------------------------------------
Shapiro-Wilk normality test

Estatstica Experimental
75

p-value: 0.2270063
According to Shapiro-Wilk normality test at 5% of significance, residuals can be
considered normal.
------------------------------------------------------------------------
Duncan's test
------------------------------------------------------------------------
Groups Treatments Means
a B 39
ab C 32
b A 26
b D 22
------------------------------------------------------------------------
Concluso (somente para o teste de Duncan): O tratamento B difere
significativamente dos tratamentos A e D. Reparem que o teste de Duncan
indicou uma diferena a mais, entre os tratamentos B e A, a qual no foi
indicada pelo teste de Tukey.
A funo crd( ) do pacote ExpDes fornece outras opes de testes de
comparaes mltiplas para serem colocadas no comando mcomp = " ". O
teste default o teste de Tukey ("tukey"). As outras opes so o teste LSD
equivalente ao teste t-student ("lsd"); o teste LSD com proteo Bonferroni
("lsdb"); o teste de Duncan ("duncan"); o teste de Student-Newman-Kews
("snk") e o teste de Scott-Knott ("sk").

8 ALGUMAS CONSIDERAES SOBRE O USO DE PROCEDIMENTOS DE


COMPARAES MLTIPLAS.
Quando desejamos comparar os diversos tratamentos com um
tratamento controle ou padro (testemunha), o teste de Dunnett o mais
indicado. Os testes de Duncan e de Tukey tm fundamentos muito
semelhantes, mas o teste de Duncan menos conservador e menos exigente
que o teste de Tukey, isto , indica diferenas significativas com mais
facilidade. Vale lembrar tambm que o teste de Duncan um teste seqencial
e a sua aplicao mais trabalhosa. Ambos os testes so exatos quando os
nmeros de repeties por tratamento forem iguais; caso contrrio os testes
so apenas aproximados. O teste t-Sudent pouco rigoroso quando usado
indiscriminadamente, devendo ser usado com cautela para testar contrastes
ortogonais definidos a priori. J o teste de Scheff bastante rigoroso e seu
uso desaconselhvel (como o teste t-Student) para a comparao entre duas
mdias de tratamentos, sendo mais indicado para testar contrastes que
envolvem mais de duas mdias.
O pacote "agricolae " tambm pode ser a utilizado para as
comparaes mltiplas. A seguir fornecido um script utilizando este pacote
# instatlando o pacote "agricolae"
install.packages("agricolae")

# requerendo o pacote agricolae


require("agricolae")

# teste de Tukey
compara.tukey <- HSD.test(gp.av,"trat")
# grfico de barras das mdias com as letras segundo com o teste de Tukey
bar.group(compara.tukey,main="Teste de Tukey", ylim=c(0,50),
xlab="Tratamentos (Raes)")

Estatstica Experimental
76

# teste de Duncan
compara.duncan <- duncan.test(gp.av,"trat")

# grfico de barras das mdias com as letras segundo o teste de Duncan


bar.group(compara.duncan,main="Teste de Duncan",ylim=c(0,50),
xlab="Tratamentos (Raes)")

# teste de Scheff
compara.scheffe <- scheffe.test(gp.av,"trat")

# grfico de barras das mdias com as letras segundo o teste de Scheff


bar.group(compara.scheffe, main="Teste de Scheff",ylim=c(0,50),
xlab="Tratamentos (Raes)")
Este script fornece a seguinte sada
HSD Test for gp
Mean Square Error: 68.75
trat, means gp std.err replication
A 26 3.820995 5
B 39 2.302173 5
C 32 4.449719 5
D 22 3.911521 5
alpha: 0.05 ; Df Error: 16
Critical Value of Studentized Range: 4.046093
Honestly Significant Difference: 15.00331

Means with the same letter are not significantly different.


Groups, Treatments and means
a B 39
ab C 32
ab A 26
b D 22
Teste de Tukey
50

a
40

ab
30

ab
b
20
10
0

B C A D

Tratamentos (Raes)

Sada do teste de Duncan


Duncan's new multiple range test for gp
Mean Square Error: 68.75

Estatstica Experimental
77

trat, means gp std.err replication


A 26 3.820995 5
B 39 2.302173 5
C 32 4.449719 5
D 22 3.911521 5

alpha: 0.05 ; Df Error: 16

Critical Range
2 3 4
11.11688 11.65753 11.99550

Means with the same letter are not significantly different.


Groups, Treatments and means
a B 39
ab C 32
b A 26
b D 22
Teste de Duncan
50

a
40

ab
30

b
b
20
10
0

B C A D

Tratamentos (Raes)

Sada do teste Scheff


Scheffe Test for gp
Mean Square Error : 68.75
trat, means gp std.err replication
A 26 3.820995 5
B 39 2.302173 5
C 32 4.449719 5
D 22 3.911521 5

alpha: 0.05 ; Df Error: 16


Critical Value of F: 3.238872
Minimum Significant Difference: 16.34646

Means with the same letter are not significantly different.


Groups, Treatments and means
A B 39
ab C 32
ab A 26
b D 22

Estatstica Experimental
78

Teste de Scheff

50
a
40

ab
30

ab
b
20
10
0

B C A D

Tratamentos (Raes)

Estatstica Experimental
79

4 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL


1. Trs extratos de origem vegetal foram fornecidos a 20 ces por via oral com a finalidade de testar
o possvel efeito sobre a presso arterial sistlica desses animais. Os ces foram divididos em grupos
de cinco animais, recebendo cada grupo um tipo de extrato, ao acaso, B, C ou D, alm de um grupo
controle A, tratado com placebo. Os dados obtidos foram:

Trat.(extratos)
Ces Totais Mdias si
(Controle) A 74,0 71,0 73,0 79,0 68,0
B 99,0 91,0 94,0 101,0 97,0
C 100,0 95,0 97,0 99,0 98,0
D 78,0 74,0 75,0 86,0 72,0
Total Geral

(a) Escreva o script da linguagem R para ler os dados da tabela acima e calcular os totais dos
tratamentos, as mdias dos tratamentos, os desvios padres dos tratamentos, o total geral,
e a mdia geral. Apresente os resultados na mesma tabela acima.
(b) Escrever o modelo matemtico do experimento, estabelecer as hipteses estatsticas H0 e
H1 e as suposies bsicas para se testar estas hipteses.
(c) Escreva o script para os clculos do quadro da anlise de varincia e apresente monte o
quadro da anova. Apresente as concluses.
(d) Aplique o teste de Tukey para comparar as mdias 2 a 2. Apresente um quadro e um
grfico de barras das mdias juntamente com as letras explicando as diferenas. Tire as
concluses.
(e) Aplique o teste de Duncan para comparar as mdias 2 a 2. Apresente um quadro e um
grfico de barras das mdias juntamente com as letras explicando as diferenas. Tire as
concluses.
(f) Aplique o teste de Dunnett para comparar as mdias com o controle A. Comente os
resultados.

2- A reduo da presso sangnea sistlica (RPS) depois da administrao de drogas para


hipertenso um dos indicadores de como os pacientes esto respondendo s drogas. No
tratamento da hipertenso, os efeitos colaterais associados com as drogas tm um particular
interesse. Neste estudo, duas drogas X e Y para a reduo dos efeitos colaterais de uma droga
padro (P) de hipertenso foi avaliada. O estudo foi conduzido em um delineamento inteiramente
casualizado com cinco tratamentos, assim definidos:

T1 Droga padro (P)


T2 P combinada com uma dose baixa de X (P+DBX)
T3 P combinada com uma dose alta de X (P+DAX)
T4 P combinada com uma dose baixa de Y (P+DBY)
T5 P combinada com uma dose alta de Y (P+DAY)

A reduo na presso sangnea (mm Hg) em um perodo de quatro semanas observadas em ces
experimentais est tabulada abaixo:

Tratamentos Repetio
1 2 3 4 Total Mdia
T1 27 26 21 26
T2 19 13 15 16
T3 15 10 10 11
T4 22 15 21 18
T5 20 18 17 16

Pede-se:
a) A anlise de varincia para testar a hiptese geral de igualdade das mdias dos tratamentos;
b) Aplique os testes t-student e Scheff nos contrates abaixo:
b.1 Existe efeito das drogas combinadas (T2 T3 T4 T5 ) na RPS?.
b.2 Existe diferena entre os efeitos mdios das doses baixa e alta da droga Y?.
b.3 Existe diferena entre a resposta mdia esperada das duas doses de X?.
(extrado de Statistical Research Methods in the Life Science, P. V. Rao, pg. 327).

Estatstica Experimental
80

Aula 5 Testes F planejados


No planejamento de um experimento, frequentemente pode-se utilizar o
teste F para responder algumas questes mais especficas. Isto implica na
decomposio dos graus de liberdade e da soma de quadrados do efeito dos
tratamentos em componentes de comparaes. Estes componentes podem ser
classes de comparaes ou tendncia das respostas. Eles podem ser testados
pela partio dos graus de liberdade e da soma de quadrados dos efeitos dos
tratamentos em contrastes simples e especficos e suas soma de quadrados
associadas. O nmero de contrastes independentes e ortogonais que podem
ser definidos igual ao nmero de graus de liberdade do efeito do tratamento.
O poder e a simplicidade deste mtodo no so muito apreciados e
compreendidos pelos pesquisadores com deveria ser. Esta metodologia
envolve a definio de contrastes ortogonais, e talvez este termo, cria a
impresso de que ele complicado e difcil. Isto esta longe de ser verdade.
Atualmente este mtodo tem trs grandes vantagens:
permite responder a questes especficas e importantes a respeito
dos efeitos dos tratamentos;
os clculos so simples; e,
proporciona uma checagem til da soma de quadrados dos
tratamentos.
Esta metodologia tambm denominada de desdobramento, ou a
decomposio dos graus de liberdade de tratamentos.
2 Soma de quadrados de um contraste.
Quando utilizamos contrastes na decomposio dos graus de liberdade
dos efeitos dos tratamentos usamos a seguinte definio para o clculo da
soma de quadrados:
Definio: a soma de quadrados de um contraste calculada pela
k
( c iYi )
2

frmula SQ(Y ) i 1 (Yi )


2
, sendo: c i os
i k ou SQ(Y i )
k
r c i2 r c i2
i 1 i 1

coeficientes do contraste; Yi os totais dos tratamentos e r o


numero de repeties (neste caso r = r1 = . . . = rk ) e
k
Yi ( c iY i )
2
uma estimativa do contraste com base nos totais.
i 1
Observaes importantes:
todo contraste tem sempre 1 grau de liberdade, assim QM(Yi) =
SQ(Yi).
geralmente, testamos H0: Yi = 0 vs. H1: Yi 0 e para tanto
usamos a estatstica F-Snedecor tendo como denominador o
quadrado mdio do erro experimental (QMR).
os contrastes devem ser planejados a priori e podem ser to
numerosos quanto acharmos necessrio.
o nmero de contrastes ortogonais entre os totais dos tratamentos
igual ao nmero de graus de liberdade associados a essa fonte
de variao, isto , se o fator tratamento tem k nveis ento
conseguiremos definir somente (k-1) contrastes ortogonais.

Estatstica Experimental
81

se Y1, Y2 ,...,Yk 1 so contrastes ortogonais envolvendo os totais dos


k nveis do fator, ento SQ( Y1 )
SQ(Y2 ) ... SQ(Yk 1 )
SQTr
a ortogonalidade dos contrastes garante a independncia entre as
concluses.
Exemplo 1: Foram comparados os efeitos de cinco tratamentos no crescimento
de alevinos de carpas (mediu-se o comprimento em cm aos dois meses de
idade) em um DIC.
T1 rao comum. (rc)
T2 rao comum + esterco. (rce)
T3 rao comum + esterco de porco + vitamina B12. (rceB12)
T4 rao comum + farinha de osso. (rcfo)
T5 rao comum + farinha de osso + vitamina B12. (rcfoB12)
Dados
Repeties
Trat. 1 2 3 4
T1 4,6 5,1 5,8 5,5
T2 6,0 7,1 7,2 6,8
T3 5,8 7,2 6,9 6,7
T4 5,6 4,9 5,9 5,7
T5 5,8 6,4 6,8 6,8

Anlise de varincia usual.


Causas da Variao G.L. S.Q. Q.M. F
Tratamentos 4 7,72 1,91 7,19
Resduo 15 4,03 0,27
Total 19 11,75

F( 4,15;0,05 ) 3,06 e F( 4,15;0,01) 4,89

Concluso: o teste significativo a 1% de probabilidade, portanto


rejeitamos H0, os tratamentos apresentam efeitos distintos sobre o crescimento
de alevinos de carpas. Esta uma informao geral sobre os efeitos dos
tratamentos. Para obtermos informaes detalhadas devemos decompor os 4
graus de liberdade dos efeitos dos tratamentos em quatro contrastes
ortogonais.
Comparaes objetivas:
rc vs demais.
Y1 4T1 T2 T3 T4 T5 4Y1 Y 2 Y3 Y 4
rce vs rcfo
Y2 T2 T3 T4 T5 Y 2 Y3 Y 4 Y5
rce vs rceB12.
Y3 T2 T3 Y 2 Y3
rcfo vs rcfoB12
Y4 T4 T5 Y 4 Y5

Estatstica Experimental
82

Contraste Y1 Y2 Y3 Y4 Y5
Y1 4 -1 -1 -1 -1
Y2 0 +1 +1 -1 -1
Y3 0 +1 -1 0 0
Y4 0 0 0 +1 -1
Usando a frmula definida acima para o clculo da soma de quadrados
dos contrastes temos:
1) rc vs demais.
Y1 4(21,0 )
27,1 26,6 22,1 25,6 17,6 cm
5


i
ci
1
2 2
(4 ) 2
(1) 2
(1) 2
(1) 2
(1) 20

(Y1 )
2 2
(17,4 )
S .Q .(Y1 )
5
3,78
4(20 )
r ci
1
2

(A obteno das S.Q. dos outros contrastes so deixadas como exerccios)


A anova com os testes F planejados ou com os desdobramentos dos
graus de liberdade do efeito dos tratamentos fica:
Causas da Variao G.L. S.Q. Q.M. F Pr(>F)
rc vs demais (Y1) 1 3,87 3,87 14,43 0.00175
rce vs rcfo (Y2) 1 2,10 2,10 7,83 0.55014
rce vs rceB12 (Y3) 1 0,03 0,03 0,12 0.00200
Rcfo vs rcfoB12 (Y4) 1 1,72 1,72 6,38 0.87434
Tratamentos (4) (7,72) 1,91 7,19 0.00193
Resduo 15 4,03 0,27
Total 19 11,75

F( 4 ,15 ; 0 ,05 ) 3 ,06 ; F( 4 ,15 ; 0 ,01 ) 4 ,89; F( 1,15 ; 0 ,05 ) 4 ,54 e F( 1,15 ; 0 ,05 ) 8 ,68
Concluses:
rc vs demais o contraste significativo (p<0,01) e pelo resultado
do contraste devemos utilizar rce ou rceB12, ou ainda, rcfo ou
rcfoB12, quando comparada com a rc.
rce vs rcfo o contraste significativo (p<0,05) e pelo resultado
do contraste verificamos que rce tem um efeito superior no
crescimento dos alevinos, quando comparada com rcfo.
rce vs rceB12 - o contraste no significativo (p>0,05), portanto o
acrscimo de vitamina B12 rce (rceB12) no afeta
significativamente, o crescimento dos alevinos, quando comparada
com a rce.
rcfo vs rcfoB12 o contraste significativo (p<0,05) e pelo
resultado do contraste devemos adicionar vitamina B12 rao
comum com farinha de osso,quando comparada com a rcfo.
Script no R para os clculos descritos acima
# entrando com o nmero de repeties
r <- 4

Estatstica Experimental
83

# criando os nveis dos tratamentos


trat <- c(rep("T1",r),rep("T2",r),rep("T3",r),rep("T4",r),rep("T5",r))
trat

# entrando com os valores


comp <- c(4.6,5.1,5.8,5.5, # observaes do tratamento T1
6.0,7.1,7.2,6.8, # observaes do tratamento T2
5.8,7.2,6.9,6.7, # observaes do tratamento T3
5.6,4.9,5.9,5.7, # observaes do tratamento T4
5.8,6.4,6.8,6.8) # observaes do tratamento T5
comp

# fazendo a anlise da varincia - ANOVA


comp.av <- aov(comp~factor(trat))

# imprimindo o quadro da ANOVA


summary(comp.av)

# Definio do contraste
c <- c(4,-1,-1,-1,-1) # contraste rc vs demais

# obteno do QMR no quadro da anova


qmr <- anova(comp.av)[2,3]
qmr

# obteno dos gl do residuo no quadro da anova


glr <- anova(comp.av)[2,1]
glr

# clculo dos totais por tratamento


t.trat <- tapply(comp,trat,sum)
t.trat

# estimativa do contraste Y com base nos totais


y.est <-sum(c*t.trat)
y.est
# clculo da soma de quadrados
sqy <- (y.est^2)/(r*sum(c^2))
sqy

# Clculo da estatstica F
fc <- sqy/qmr
fc
# Clculo do valor de p associado estatstica fc
valor.p <- 1-pf(fc,1,glr)
valor.p
Para obter os resultados referentes aos outros contrastes basta
substituir o objeto c na linha # Definio do contraste pelo contraste
correspondente definido abaixo e executar todo o script novamente

Estatstica Experimental
84

#c <- c(0, 1, 1,-1,-1) # contraste rce vs rcfo


#c <- c(0, 1,-1, 0, 0) # contraste rce vs rceB12
#c <- c(0, 0, 0, 1,-1) # contraste rcfo vs rcfoB12
Estes resultados podem ser obtidos facilmente com o pacote gmodels
# instalando o pacote gmodels
install.packages("gmodels")

# requerendo o pacote para o ambiente R


require(gmodels)

# juntando os 4 contrastes no objeto cte


cte <-rbind(c(4,-1,-1,-1,-1), c(0, 1, 1,-1,-1),
c(0, 1,-1, 0, 0), c(0, 0, 0, 1,-1))

# calculando a anova com desdobramento dos gl dos tratamentos


comp.av <- aov(comp ~ trat,contrast = list(trat = make.contrasts(cte)))

# imprimindo o quadro da ANOVA


summary(comp.av, split = list(trat = 1:4))
Quando os tratamentos e/ou fatores utilizados num experimento so de
natureza qualitativa (raa, sexo, cultivares, tratos culturais etc.) os testes de
comparaes de mdias (teste t-Student, testes de Tukey, Duncan, Scheff
etc.) se aplicam sem restries. A esses casos se equiparam os fatores ou
tratamentos quantitativos (doses de uma droga, tempo, etc.) quando h s
dois nveis (presena e ausncia, por exemplo). O mesmo no acontece,
porm, quando o tratamento ou fator quantitativo tem mais de dois nveis, por
exemplo:
doses crescentes de cobre na alimentao de galinhas (0, 400 e
800 ppm);
doses crescentes de uma droga;
0%, 20%, 40% e 60% de substituio de um ingrediente da rao
por farelo de soja.
Em tais situaes essencial avaliar o comportamento da varivel resposta ao
longo dos nveis do fator, atravs de uma equao de regresso. Por exemplo:
a equao que associa a freqncia cardaca em funo de doses de uma
droga quase sempre desconhecida, mas em geral, pode ser bem estimada
por meio de uma equao polinomial do tipo:
Y a0 a1 x a2 x 2 a3 x 3 ... ,
sendo Y, a resposta avaliada e x os nveis quantitativos do fator (tratamentos).
O ajuste e a interpretao da equao de regresso quando o polinmio
de grau muito elevado so tarefas bastante complexas. Porm, quando os
nveis do fator quantitativo so igualmente espaados, o estudo do
comportamento das mdias pode ser feito utilizando o mtodo dos polinmios
ortogonais, que ser apresentado a seguir atravs de um exemplo.
Exemplo: os efeitos de quatro tratamentos no ganho de peso (g) de
alevinos de carpas foram comparados em um DIC.
T1 rao comum.
T2 rao comum + 10 mg de B12.

Estatstica Experimental
85

T3 rao comum + 20 mg de B12.


T4 rao comum + 30 mg de B12.
Dados
Repeties
Trat. 1 2 3 4
0 6,80 6,50 6,40 6,50
10 7,90 6,60 6,80 6,20
20 8,30 8,40 8,60 9,20
30 9,50 9,80 10,00 10,70

H 0 : 1 2 3 4
H1 : pelo menos duas mdias

Anlise de varincia usual.


Causas da Variao G.L. S.Q. Q.M. F
Tratamentos 3 31,03 10,02 41,3
Resduo 12 2,95 0,25
Total 15 33,98
F( 3 ,12 ; 0 ,05 ) 3 ,49 F( 3 ,12 ; 0 ,01 ) 5 ,95

O teste F significativo a 1% de probabilidade, portanto rejeita-se Ho, os


tratamentos apresentam efeitos distintos sobre o crescimento dos alevinos de
carpas. Como os nveis so eqidistantes, 0, 10, 20 e 30 mg a decomposio
dos graus de liberdade pode ser feita com uso de polinmios ortogonais,
usando-se os coeficientes dos contrastes encontrados em tabelas. As tabelas
so construdas em funo do nmero de tratamentos, denominados nveis.
Assim, como temos 4 tratamentos, temos 4 nveis e o polinmio mximo o de
grau 3. Consultando as tabelas dos coeficientes dos polinmios ortogonais
(Gomes P., 1966, p. 314, Sampaio, I.B.M, 1998, p. 215) , podemos montar a
seguinte tabela
Tratamentos Coeficientes para 4 nveis
(Totais) 1 grau 2 grau 3 grau
T1=26,20 -3 +1 -1
T2=27,50 -1 -1 +3
T3=34,50 +1 -1 -3
T4=40,00 +3 +1 +1

I c I2 20 4 20

Assim, para o efeito linear temos:

YLinear (3 )
T1 (1)
T2 (1)
T3 (3 )
T4
(3 )(26,20 )
(1)(27,50 )
(1)(34,50 )
(3 )(40,00 )

48,40
2
(48,40 )
S .Q .(YLinear )
29,28
(4 )(20 )
(A obteno das SQ dos efeitos quadrticos e cbicos so deixados como exerccio)

Estatstica Experimental
86

A anlise de varincia com desdobramento dos graus de liberdade dos


tratamentos por polinmios ortogonais.
Causas da Variao G.L. S.Q. Q.M. F
Regresso linear 1 29,28 29,28 119,32
Regresso Quadrtica 1 1,10 1,10 4,49
Regresso Cbica 1 0,65 0,65 2,64
Tratamentos (3) (31,03) 10,34 42,15
Resduo 12 2,95 0,25
Total 15 33,98
F( 3 ,12 ; 0 ,05 ) 3 ,49; F( 3 ,12 ; 0 ,01 ) 5 ,95 ; F( 1,12 ; 0 ,05 ) 4 ,75 e F( 1,12 ; 0 ,01 ) 9,33
Concluso: somente a componente do 1 grau foi significativa (p<0,01),
ou seja, a diferena entre os valores mdios dos tratamentos est sendo
explicada por uma equao linear, Y a bx , cujos parmetros a e b so
estimados por:
k k

k X i Yi
X iY i i 1
k
i 1

b i1
k e a Y b X ,
k ( X i )
2

X i i 1
i 1
2

k
sendo: b e a , os estimadores de mnimos quadrados de b e a,
respectivamente, xi = 0, 10, 20 e 30 as doses de vitamina B12; y i = 6,55, 6,80,
8,63 e 10,00 so os comprimentos mdios dos alevinos, para i = 1, 2, 3, 4.
Utilizando essas frmulas, obtemos a equao
Y 6 ,168 0 ,122 X
Script no R para os clculos acima
# entrando com o nmero de repeties
r <- 4

# criando os nveis dos tratamentos


trat <- c(rep(0,r),rep(10,r),rep(20,r),rep(30,r))
trat

# entrando com os valores


g.peso <- c(6.80, 6.50, 6.40, 6.50, # observaes do tratamento 1
7.90, 6.60, 6.80, 6.20, # observaes do tratamento 2
8.30, 8.40, 8.60, 9.20, # observaes do tratamento 3
9.50, 9.80, 10.00, 10.70) # observaes do tratamento 4

#imprimindo o resumo do arquivo


head(g.peso)

# calculando o quadro da ANOVA


gpeso.av <- aov(comp~factor(trat))

# imprimindo o quadro da anova


anova(comp.av)
# obteno do QMR no quadro da anova
qmr <- anova(comp.av)[2,3]

Estatstica Experimental
87

qmr

# obteno dos gl do residuo no quadro da anova


glr <- anova(comp.av)[2,1]
glr

# clculo dos totais por tratamento


t.trat <- tapply(g.peso,trat,sum)
t.trat

# Definio do contraste
c <- c(-3,-1,1,3) # efeito linear

# estimativa do contraste linear com base nos totais


y.est <-sum(c*t.trat)
y.est

# clculo da soma de quadrados


sqy<- (y.est^2)/(r*sum(c^2))
sqy

# calculo da estatstica F
fc <- sqy/qmr
fc

# calculo do valor de p da estatstica fc


valor.p <- 1-pf(fc,1,glr)
valor.p
Para obter os resultados referentes aos outros contrastes basta
substituir o objeto c na linha # Definio do contraste pelo contraste
correspondente definido abaixo e executar todo o script novamente
#c <- c(1,-1,-1,1) # efeito quadrtico
#c <- c(-1,3,-3,1) # efeito cbico

Este quadro da anova pode ser obtido facilmente com o pacote gmodels.
No h necessidade de instalar o pacote gmodels novamente, dado que ele j
foi instalado no script anterior. Basta requer-lo.
Script no R utilizando o pacote gmodels
# requerendo o pacote para o ambiente R
require(gmodels)

# juntando os 3 contrastes no objeto cte


cte<-rbind(c(-3, -1, 1, 3), c(1, -1, -1, 1), c(-1, 3, -3, 1))

# clculando a anova com desdobramento dos gl dos tratamentos


gpeso.av <- aov(g.peso ~ trat,contrast = list(trat = make.contrasts(cte)))
# imprimindo o quadro da ANOVA
summary(gpeso.av, split = list(trat = 1:4))

Estatstica Experimental
88

Este quadro da anova com os desdobramentos dos graus de liberdade


dos tratamentos junto com as equaes linear, quadrtica e cbica so
facilmente obtidos com o pacote ExpDes.
Script no R utilizando o pacote ExpDes

#requrendo o pacote ExpDes


require(ExpDes)

#quadro da anova com o desdobramento dos graus de liberdade dos trat


crd(trat,g.peso,quali=F)

Fazendo o grfico da reta de regresso

# entrando com os valores da dose (x)


dose<-c(0,10,20,30)
# clculo das mdias dos tratamentos (y)
m.trat<-tapply(g.peso,trat,mean)
m.trat

# grfico de disperso (dose x ganho de peso)


plot(dose,m.trat,pch=16, col="black",ylab="ganho de peso (g)")

# ajustando a reta de regresso


reg.lin<-lm(m.trat~dose)

#imprimindo os resultados do ajuste


summary(reg.lin)

# colocando a reta estimada no grfico de disperso


abline(reg.lin,col="blue",lwd=2)

Estatstica Experimental
89

5 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL


1) Num experimento estudou-se a adio de triguilho, a uma dieta bsica de milho e farelo de
soja na alimentao se sunos, mestios ( Landrace x Large White), com peso inicial de 10,5 kg
durante um perodo experimental de 40 dias, mantidos em gaiolas metlicas de 1,90 x 0,74 m.
O delineamento experimental foi o inteiramente casualizado com 5 tratamentos e 8 repeties
e a parcela experimental representada por 4 animais (dois machos castrados e duas fmeas).
Os tratamentos consistiram na incluso de 0; 7,5; 15,0; 22,5; e 30% de triguilho em dietas
base de milho e soja.
Os ganhos de peso mdio dirio em gramas (mdia dos 4 animais na parcela) foram:
Tratamentos Repeties Total
% de triguilho 1 2 3 4 5 6 7 8
0,0 340 320 310 350 320 340 330 340 2650
7,5 360 350 350 360 370 380 340 350 2860
15,0 370 370 380 390 360 370 360 380 2980
22,5 380 390 380 390 360 360 360 390 3010
30,0 400 390 410 420 380 390 410 420 3220
14720
A anlise de varincia preliminar a seguinte:
Causa da variao GL S. Quadrados Q. M F
Tratamentos 4 21915.00 5478,55 31,30**
Resduo 35 6125,00 175,00
Total 39
** Significativo p<0,01
a- Escrever o script na linguagem do R para reproduzir o quadro da anova acima.
b- Escrever tambm o script para montar a tabela de anlise de varincia com desdobramento
dos graus de liberdade de tratamentos por polinmios ortogonais.
Causa da variao GL S. Q. Q. M. F Vapor de p
Tratamentos 21915.00 5478,55 31,30**
Y1 (Linear)
Y2 (Quadrtico)
Y3 (Cbico)
Y4 (4 grau)
Resduo 6125,00 175,00
Total 0,3426
c- Tirar as concluses prticas possveis para este experimento.
d- Calcular as mdias e os erros padres das mdias dos tratamentos e o coeficiente de
determinao e de variao do experimento.
Coeficientes dos polinmios ortogonais para 5 tratamentos:
Linear: -2 -1 0 1 2
Quadrtico. : 2 -1 -2 -1 2
Cbico: -1 2 0 -2 1
4 Grau : 1 -4 6 -4 1
2) Num experimento inteiramente casualizado de competio de linhagens de aves visando o
ganho de peso aos 60 dias de idade, foram utilizados 4 tratamentos e 6 repeties. Os
tratamentos, com as respectivas mdias de ganho de peso foram as seguintes:
1- ARBOR ACRES y 1 1,81 kg
2- KIMBER 44 y 2 1,59 kg
3- PILCH y 3 1,61 kg
4- COBBS y 4 1,71 kg
Para a anlise de varincia dos ganhos de peso, obteve-se: S.Q. Tratamentos = 0,2266 e
S.Q. Total = 0,3426
a) Sejam os contrastes:
y 1 1 2 3 4 ; y 2 1 2 ; y 3 3 4
Verificar se estes contrastes so ortogonais entre si.

b) Preencher o quadro da anova abaixo:

Estatstica Experimental
90

F.V. GL S. Q. Q. M. F Vapor de p
Tratamentos 0,2266
Y1
Y2
Y3
Resduo
Total 0,3426
c) Apresente as concluses destes testes.
d) Calcular R2 e o C.V. deste experimento e concluir.
3- Num experimento inteiramente casualizado, com 5 tratamentos e 6 repeties, estudou-se o
efeito da infestao de ovinos e caprinos por larvas de Gaigeria pachyscelis (Nematoda:
Ancylostomatoidea).
Os tratamentos aplicados foram:
T1 - infestao com 150 larvas por animal
T2 - infestao com 300 larvas por animal
T3 - infestao com 600 larvas por animal
T4 - infestao com 1200 larvas por animal
T5 - infestao com 2400 larvas por animal.
A anlise de varincia do nmero de semanas decorridas at a morte do animal
apresentou os seguintes resultados.
S.Q. Tratamentos = 5,7204
S.Q. Total =13,1829
Sabendo-se, tambm que as mdias do nmero de semanas, decorridas at a morte do
animal, por tratamento foram:
y 1 4,28 y 2 4,16 y3 = 3,55 y 4 = 3,22 y5 = 2,71
Pede-se:
a) Montar a anlise de varincia e concluir.
F.V. GL S. Q. Q. M. F Vapor de p
Tratamentos 5,7204
Resduo
Total 13,1829
b) Verificar pelo teste de Tukey, Duncan e Scheff ao nvel de 5% de probabilidade, quais
as mdias de tratamentos que esto diferindo significantemente entre si.

Estatstica Experimental
91

Aula 6 Delineamento em blocos casualizados (DBC)


Suponha que um experimentador esteja interessado em estudar os
efeitos de 3 diferentes dietas. A primeira providncia do pesquisador foi a de se
inteirar a respeito da natureza do material experimental disponvel. Feito isto,
constatou que ele disporia de 12 animais com aproximadamente o mesmo
peso. Entretanto, estes 12 animais eram provenientes de 4 ninhadas, cada
uma contendo trs animais. Dentro de uma ninhada, os trs animais foram
sorteados s trs dietas. Os animais foram colocados em 12 baias idnticas e
alimentados com as dietas sorteadas, em idnticas condies. Mediu-se,
ento, o ganho de peso desses animais depois de 12 semanas. Os dados
obtidos so apresentados no quadro abaixo:
Dieta Ninhada
1 2 3 4 Total
A 28,7 29,3 28,2 28,6 114,8
B 30,7 34,9 32,6 34,4 132,6
C 31,9 34,2 34,9 35,3 136,3
Total 91,3 98,4 95,7 98,3 383,7
Organizando as observaes em arquivos com extenso .xls ou .txt
dieta.xls dieta.txt
dieta ninhada gpeso dieta ninhada gpeso
A Ninhada1 28.7
A Ninhada1 28.7
A Ninhada2 29.3
A Ninhada2 29.3 A Ninhada3 28.2
A Ninhada3 28.2 A Ninhada4 28.6
A Ninhada4 28.6 B Ninhada1 30.7
B Ninhada1 30.7 B Ninhada2 34.9
B Ninhada3 32.6
B Ninhada2 34.9 B Ninhada4 34.4
B Ninhada3 32.6 C Ninhada1 31.9
B Ninhada4 34.4 C Ninhada2 34.2
C Ninhada1 31.9 C Ninhada3 34.9
C Ninhada4 35.3
C Ninhada2 34.2
C Ninhada3 34.9
C Ninhada4 35.3
(Dica: primeiro digite os dados no excel, para depois coloc-lo no bloco de notas)

O delineamento experimental para este ensaio de dietas um exemplo


de um Delineamento em Blocos Casualizados com trs tratamentos e quatro
blocos. Os tratamentos so nveis de um fator experimental, as trs dietas; os
blocos so os nveis do fator confundido, as ninhadas. Dado que os animais em
diferentes ninhadas respondem diferentemente a uma dada dieta, a ninhada
considerada, um fator de confundimento. As 12 unidades experimentais
(animais) so agrupados em 4 blocos, de tal forma que, dentro de cada grupo,
trs unidades so afetadas pelo mesmo nvel do fator de confundimento. Por
causa da poro das caractersticas inerentes aos animais dentro de uma
mesma ninhada (bloco), suas respostas sero muito similares, enquanto que
as respostas dos animais pertencentes a diferentes ninhadas iro variar muito;
isto , as unidades experimentais so mais homogneas dentro dos blocos do
que entre os blocos. Assim, resumidamente, podemos definir que um DBC
um delineamento no qual as unidades (unidades experimentais) s quais os
tratamentos so aplicados so subdivididos em grupos homogneos,
denominados de blocos, tal que o nmero de unidades experimentais em um
bloco igual ao nmero (ou algum mltiplo do nmero) de tratamentos
estudados. Os tratamentos so ento sorteados s unidades experimentais

Estatstica Experimental
92

dentro de cada bloco. Deve-se ressaltar que cada tratamento aparece em cada
bloco, e todo bloco recebe todos os tratamentos. Quando se usa o DBC, o
objetivo isolar e remover do termo de erro (resduo) a variao atribuda ao
bloco, garantindo assim, que as mdias dos tratamentos esto livres do efeito
dos blocos. A efetividade deste delineamento depende da habilidade em se
obter blocos homogneos de unidades experimentais. A habilidade para formar
blocos homogneos depende do conhecimento que o pesquisador tem do
material experimental. Quando os blocos so usados adequadamente, o QMR
(quadrado mdio do resduo) no quadro da ANOVA ser reduzido, a estatstica
F aumentar, e a chance de se rejeitar H0 (hiptese de nulidade) ser maior.
Em experimentos com animais, quando suspeita-se que diferentes raas
de animais responder diferentemente ao mesmo tratamento, a raa do animal
pode ser usada como um fator a ser considerado na formao dos blocos. O
DBC pode, tambm, ser empregado efetivamente quando um experimento
deve ser conduzido em mais de um laboratrio (bloco) ou quando vrios dias
(blocos) so requeridos para a realizao do experimento. No DBC temos os
trs princpios bsicos da experimentao: repetio, casualizao e
controle local.
Vantagens do DBC
Com o agrupamento das parcelas, geralmente se obtm resultados
mais precisos que aqueles obtidos num DIC.
Desde exista material experimental suficiente, o delineamento ser
sempre balanceado, podendo-se incluir qualquer nmero de
tratamentos.
A anlise estatstica bastante simples.
Se a varincia do erro experimental maior para alguns
tratamentos que para outros, pode-se obter um erro no viesado
para testar qualquer combinao especfica das mdias dos
tratamentos.

Principal desvantagem
Ocorre quando da perda de parcela(s) em algum tratamento. Apesar de
existir um mtodo apropriado de estimao desses valores, h a perda de
eficincia na comparao de mdias envolvendo esses tratamentos.

Esquematicamente para um DBC com 4 tratamentos e 3


blocos (classes de idade) temos:

1) Unidades experimentais heterogneas (Fonte: Vieira, 2006, pag. 15).

Estatstica Experimental
93

2) Constituio dos 3 blocos. ( 3 classes de idades ).

3) Delineamento de um experimento em blocos casualizados.

2 Organizao dos dados no DBC.


Vamos considerar k -tratamentos; r blocos e y ij o valor observado na
parcela que recebeu o tratamento i e se encontra no bloco j. Assim, um quadro
para representar os valores amostrais de um DBC pode ser da forma abaixo:

Estatstica Experimental
94

Blocos
1 2 3 ... j ... r Total Mdia
Trat.
1 Y11 Y12 Y13 ... ... ... Y1r Y1+ Y1
2 Y21 Y22 Y23 ... ... ... Y2r Y2+ Y 2.
3 Y31 Y32 Y33 ... ... ... Y3r Y3+ Y 3
. . . . . ... . . . .
. . . . . ... . . . .
. . . . . ... . . . .
i . . . . Yij . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
k Yk1 Yk2 Yk3 ... ... ... Ykr Yk+ Yk
TOTAL Y+1 Y+2 Y+3 ... Y+j ... Y+r Y++
3 Modelo matemtico
Yij j i ij i 1, 2,, k e j 1, 2, , r
sendo:
y ij a observao que recebeu o i simo tratamento no j simo bloco;
mdia geral comum a todas as observaes ;
r
j o efeito do j simo bloco, com
j
j
1
0;

r
i efeito do i simo tratamento com
j
i
1
0;

ij o efeito do erro aleatrio.

4 Suposies do modelo. Neste modelo,


cada y ij observado constitui uma amostra aleatria independente
de tamanho 1 de cada uma das kr populaes
os ij so independentes e normalmente distribudos com mdia 0
e varincia 2 , ou seja, ij ~ N( 0 , 2 ) . Isto implica em que as kr
populaes so normalmente distribudas com mdia ij e a
mesma varincia 2 , ou seja, y ij ~ N( ij , 2 ) ;
os efeitos de blocos e tratamentos so aditivos. Esta suposio
pode ser interpretada como no existe interao entre tratamentos
e blocos. Em outras palavras, uma particular combinao bloco-
tratamento no produz um efeito que maior que ou menor que a
soma dos efeitos individuais.

4 Hiptese estatstica

Podemos testar
H 0 : i 0, com i 1, 2,..., k H 0 : 1 2 ... k 0
ou
H 1 : nem todos os i 0 H 1 : i j i j

Estatstica Experimental
95

Geralmente o teste de hiptese com relao aos efeitos de blocos no


feito por dois motivos: primeiro o interesse principal testar os efeitos de
tratamento, o propsito usual dos blocos eliminar fontes estranhas de
variao. Segundo, embora as unidades experimentais sejam distribudas
aleatoriamente aos tratamentos, os blocos so obtidos de uma maneira no
aleatria.

6 Partio da soma de quadrados


Voltemos ao quadro de representao das observaes no DBC no item
2
Podemos identificar os seguintes desvios:
y ij y , como o desvio de uma observao em relao a mdia
amostral geral;
y ij y i , como o desvio da observao em relao mdia de seu
grupo ou do i-simo tratamento;
y i y , como o desvio da mdia do i-simo tratamento em
relao mdia geral.
y j y como o desvio da mdia do j-simo bloco em relao
mdia geral.
Consideremos a identidade
(y ij y )
(y i y )
(y j y )
(y ij y i y j y )
,
a qual representa a a variao de uma observaes em relao mdia
geral amostral como uma soma da variao desta observao em relao
mdia de seu grupo, com a variao desta observaoem relao mdia do j-
simo bloco em que se encontra esta observao, com a variao do erro
experimental . Elevando-se ao quadrado os dois membros da identidade
acima e somando em relao aos ndices i e j, obtemos:
k r k r k r


i j
1
(y ij y
1

2
) (y ij y i )
i 1 j 1
2
(y j y )
2

i 1 j 1
k r
(y ij y i y j y )
2
,
i 1 j 1

Descrio de cada termo da expresso acima. O termo


k ri


i j
(y ij y
1 1

2
) ,

denominado de Soma de Quadrados Total e vamos denot-lo por SQT.O


nmero de graus de liberdade associado SQT kr - 1, ou N 1, pois temos N
observaes e a restrio
k ri


i j
1
(y ij y
1
)
0.

O termo:

k ri


i j
(y i
1 1
y )
2
,

denominado de Soma de quadrados de tratamentos, representada por


SQTr, e uma medida da variabilidade entre os tratamentos. Quanto mais

Estatstica Experimental
96

diferentes entre si forem as mdias dos tratamentos, maior ser a SQTr. Desde
que temos k tratamentos e a restrio de que
k

( y
i 1
i y ) 0 ,

a SQTr est associada a k-1 graus de liberdade.


O termo
k ri

( y
i 1 j 1
j y )2 ,

denominado de Soma de quadrados de blocos, representada por SQB, e


uma medida da variabilidade entre os blocos. Quanto mais diferentes entre si
forem as mdias dos blocos, maior ser a SQB, justificando assim, a utilizao
do delineamento em blocos. Desde que temos r blocos e a restrio
r


j
(y
1
j y )
0,

a SQB est associada a r-1 graus de liberdade.


Finalmente, o termo
k r


i j
(y ij y i
1 1
y j y )
2
,

denominado SQR. Notem que a magnitude da SQR no depende da


diferena entre as mdias dos tratamentos. Os graus de liberdade associada
SQR (k-1)(r-1), isto , o produto dos graus de liberdade dos tratamentos e
blocos. Assim,
SQT SQB SQTr SQR ,
e os graus de liberdade associados a cada membro da equao acima fica
total blocos tratamentos resduo
kr-1 = (r-1) + (k-1) + (k-1)(r-1)

7 Quadrado mdios.
Dividindo a SQB, SQTr e SQR pelos correspondentes graus de
liberdade, obtemos, respectivamente o Quadrado Mdio Blocos (QMB), o
Quadrado Mdio Entre Tratamentos (QMTr) e o Quadrado Mdio Resduo,
isto ,
SQB SQTr SQR
QMB e QMTr e QMR
r 1 k 1 (k 1)(r 1)

8 Estatstica e regio crtica do teste


A estatstica para o teste
QMTr
Fc ,
QMR
a qual, deve ser prximo de 1 se H0 for verdadeira, enquanto que valores
grandes dessa estatstica so uma indicao de que H0 falsa. A teoria nos
assegura que Fc tem, sob H0 distribuio F Snedecor com (k -1) e (k-1)(r-1)
graus de liberdade no numerador e no denominador, respectivamente.
Resumidamente, indicamos:
Fc ~ F(k 1( , sob H 0 .
, k 1)(r 1), )

Rejeitamos H0 para o nvel de significncia se

Estatstica Experimental
97

Fc F(k 1(
, k 1)(r 1), ) ,

sendo, F( k 1 , ( k 1 )( r 1 ), ) o quantil de ordem (1 ) da distribuio F-Snedecor


com (k -1) e (k-1)(r-1) graus de liberdade no numerador e no denominador.

9 Quadro de anlise de varincia (anova)


Dispomos as expresses necessrias ao teste na Tabela abaixo,
denominada de Quadro de Anlise de Varincia (ANOVA).
Fonte de variao gl SQ QM F
r Y (Y )
2 2
SQB
1 k

j

kr r 1
Blocos r1 j

k
Y i 2 (Y )
2 SQTr QMTr
Tratamentos k-1

i1 r

kr k 1 QMR
SQR
Resduo (k-1)(r-1) ( k 1 )( r 1 )

k r
(Y )2

Y ij 2

kr
TOTAL kr 1 i
1J 1

Pode-se provar que:


E( QMR ) 2 , ou seja, QMR um estimador no viesado da
varincia 2 ;
r k
E(QMTr ) 2 i , ou seja, QMTr um estimador no
(k 1)i 1
viesado da varincia 2 se a hiptese H0 : 1 2 ... k 0
verdadeira.
r
k
E ( QMB ) 2 j
( r 1 ) j 1

10 Detalhes computacionais
Apresentaremos alguns passos que facilitam os clculos das somas de
quadrados da ANOVA.
( y )2
Calcule a correo para a mdia CM ;
N
Calcule a Soma de Quadrados dos Totais (SQT)
k r
SQT y ij2 CM ;
i 1 j 1

Calcule a Soma de Quadrados Entre os Tratamentos (SQTr)


r
Yi 2
SQTr CM ;
i 1 r

Calcule a Soma de Quadrados de blocos (SQB)


r Y2
SQB
j
CM ;
j 1 k

Calcule a Soma de Quadrados Residual (SQR) pela diferena, isto


, SQR SQT SQTr SQB ;

Estatstica Experimental
98

Calcule o Quadrado Mdio entre os Tratamentos (QMTr) e o


Quadrado Mdio Residual (QMR)
SQB SQTr SQR
QMB , QMTr e QMR
r 1 k 1 ( k 1 )( r 1 )
QMTr QMB
Calcule Fc para tratamentos FcTr e FcBl
QMR QMR
11 Exemplo 1
Vamos considerar os dados apresentados no item1.
Os clculos para montar-mos o quadro da ANOVA so:
k = 3, r = 4, e kr = N =(3)(4) =12. Ento
Graus de liberdade:
Total kr 1 N 1 ( 3 )( 4 ) 1 12 1 11; Trat . k 1 3 1 2
Blo cos r 1 4 1 3 e Re s ( k 1 )( r 1 ) ( 3 )( 2 ) 6
( 383,80 ) 2
CM 12275,20
12
SQT ( 28 ,7 ) 2 ( 29,3 ) 2 ... ( 35 ,3 ) 2 CM

12353,35 12268,81 84 ,54
(114,8 ) 2 (132,6 ) 2 (136,3 ) 2
SQTr CM
4 4 4
12334,87 12268,81 66 ,06
( 91,3 ) 2 ( 98 ,4 ) 2 ( 95 ,7 ) 2 ( 98 ,3 ) 2
SQB CM
3 3 3 3
12279,88 12268,81 11,07
SQR SQT SQTr SQB 84,54 66,06 11,07 7 ,41
66,06 11,07 7 ,41
QMTr 33,03, QMB 3 ,69 e QMR 1,24
2 3 6
QMTr 33 ,03 QMB 3 ,69
FcTr 26 ,64 e FcBl 2 ,99
QMR 1,24 QMR 1,24
Organizando estes resultados no Quadro da ANOVA, temos:
Fonte de variao g.l. SQ QM Fc
Dietas 2 66,06 33,03 26,75
Ninhadas 3 11,07 3,69 2,99
Resduo 6 7,41 1,235
Total 11 84,54

Das tabelas das distribuies F, temos que


F( 2 ,6 , 0 ,05 ) 5 ,14 e F( 2 ,6 , 0 ,01 ) 10,92 . O valor FcTr = 26,75 maior do que estes
valores tabelados, ento rejeitamos a hiptese nula H0 para um nvel
0 ,01, ou 1% de probabilidade (se significativo a 1%, tambm
significativo a 5%), e conclumos que existe uma diferena entre as trs dietas.
As concluses sobre as diferenas entre os efeitos de ninhadas (blocos)
podem ser baseadas no Fc para blocos (FcBl = 2,98 com p=0,118). Os
resultados indicam que no existe uma variao significativa entre as ninhadas
nos ganhos de peso.

Estatstica Experimental
99

O teste F da ANOVA para os blocos um teste aproximado mesmo


quando as suposies so satisfeitas. Alguns pesquisadores sugerem que no
se considere o efeito colocado nos blocos em futuros estudos similares,
somente se o valor mnimo significativo (valor de p) associado estatstica
calculada for maior ou igual a 0,25 ( p 0 ,25 ) . Para estes dados, FcBl = 2,99
tem um p = 0,118. Portanto, mesmo que existe insuficientes evidncias para
rejeitar H0 : j 0 , ou seja, no existe efeito de ninhada, no uma boa idia
ignorar os efeitos de ninhada em futuros estudos.
O script no R para obter os resultados acima apresentado abaixo
# lendo o arquivo dieta.txt e armazenando no objeto dados
dados.ex1 <- read.table("dieta.txt",h=T)
head(dados.ex1)

Se quisermos calcular a mdia de gpeso e digitarmos o comando


mean(gpeso)

o programa dar como resposta:


Erro em mean(gpeso) : objeto 'gpeso' no encontrado

necessrio mostrar o caminho de procura dos objetos. Ou seja, quando voce


usa um nome do objeto o R vai procurar este objeto no caminho indicado, na
ordem apresentada. Pois bem, podemos adicionar um novo local neste
caminho de procura e este novo local pode ser o objeto dados.ex1. Digite o
seguinte comndo e compare com o anterior:

# anexando o objeto dados.ex1 no caminho de procura


attach(dados.ex1)

# clculo da mdia da coluna com dados de ganho de peso (gpeso)


mean(gpeso)

# mostra o caminho agora com o objeto dados.ex1 includo


search()

# grficos box-plot para cada dieta com a cor 5


boxplot(gpeso~dieta,col=5)

# estatisticas descritivas do box-plot de cada dieta


e.des<- tapply(gpeso,dieta,summary)
e.des

# mdia do ganho de peso de cada dieta


m.gpeso <- tapply(gpeso,dieta,mean)
m.gpeso

# desvio padro do ganho de peso de cada dieta


sd.gpeso <- tapply(gpeso,dieta,sd)
sd.gpeso

# anlise de varincia

Estatstica Experimental
100

gpeso.av <- aov(gpeso~factor(ninhada) + factor(dieta))


summary(gpeso.av)

# outra forma de se obter as mdias do gpeso das dietas e das ninhadas


model.tables(gpeso.av,type="means")

# efeitos das dietas e das ninhadas


model.tables(gpeso.av,type="effects")

# obtendo os resduos de cada observao


residuos <- resid(gpeso.av)
residuos

# grfico Q-Q da normalidade


qqnorm(residuos,pch=16,col=1)
qqline(residuos,lwd=2,col=2)

# teste de normalidade de Shapiro-Wilks para os resduos


shapiro.test(residuos)

# teste de Bartlett para a igualdade das varincia populacionais das dietas


bartlett.test(gpeso~factor(dieta)+factor(ninhada))

Outra forma de se obter estes resultados pelo pacote ExpDes com a


funo rbd( )
# requerendo o pacote ExpDes
require(ExpDes)

# anova pelo ExpDes


rbd(dieta,ninhada,gpeso,quali=T,mcomp="tukey")

Ateno! Para retirar o objeto do caminho de procura basta digitar


detach(dados.ex1)
# mostra o caminho agora com o objeto dados.ex1 excludo
search()
NOTA IMPORTANTE: Sempre use detach () antes de anexar um novo arquivo
de dados, especialmente se as colunas dos dois arquivos tem nomes idnticos,
se no haver problemas!

12 Estimao de uma parcela perdida


Um problema relativamente srio deste tipo de delineamento ocorre
quando perdemos uma (ou mais) parcela(s) durante o desenvolvimento do
experimento. Vamos considerar o seguinte exemplo:
Exemplo:
Classe de idade (Blocos)
Trat. 1 2 3 4 Total
A 15 11 20 18 64
B 22 31 45 26 124
C 33 37 * 30 100
D 44 31 49 34 158
E 37 30 36 21 124
Total 151 140 150 129 570

Estatstica Experimental
101

A generalizao destes dados pode ser representada no quadro abaixo


Blocos
Trat. 1 2 3 ... j ... r Total
1 Y11 Y12 Y13 ... ... ... Y1r Y1
2 Y21 Y22 Y23 ... ... ... Y2r Y2
. . . . . ... . . .
. . . . . ... . . .
. . . . . ... . . .
i . . . . Yij . . Yi
. . . . . . .
. . . . . . . .
. .
. . . . . . .
. .
K Yk1 Yk2 Yk3 ... ... ... Ykr Yi
Total Y
Y
Y1 Y 2 ... j
...
Y r

sendo:
Yij a estimativa da parcela perdida;
k o nmero de tratamentos e r o nmero de b locos;
Y o total das parcelas disponveis;
YI o total das parcelas res tan tes no tratamento onde ocorreu a parcela perdida;
Y j o total das parcelas res tan tes no b loco onde ocorreu a parcela perdida.
Uma soluo interessante para o caso da perda de uma parcela consiste
em estimar seu valor usando a frmula:
kY rY j Y
Yij I
(k 1)(r 1)
No exemplo acima, temos uma parcela perdida no tratamento C no
bloco 3 (classe de idade). Nestes dados temos:
k 5, r 4, Y 3 150, Y3 100 e Y 570;

a estimativa da parcela dado por


5(100 )
4(150 ) 570
Yij 44,17
(5 1)(4 1)
Este valor deve ser substitudo no lugar do dado perdido e a anlise
feita como anteriormente. A nica diferena que se perde um grau de
liberdade no resduo, obtendo-se o seguinte quadro de anlise de varincia:

Fonte de Variao g.l. SQ QM Fc


Blocos 3 488,56 162,86
Tratamentos 4 1289,00 322,25 10,21
Resduo 11 347,18 31,56

Total 18 2124,75

F(4; 11; 0,05) = 3,36; F(4; 11; 0,01) = 5,67; F(3; 11; 0,05) = 3,59 ; F(3; 11; 0,01) = 6,62

Estatstica Experimental
102

Observao: Nessa ltima anlise, o quadrado mdio do resduo est


corretamente estimado, mas aquele correspondente a tratamento est
ligeiramente exagerado. Para corrigi-lo, basta subtrair da SQTr a seguinte
quantidade:
k 1 Y j 2
U (Yij )
k k 1
5 1 150 2
Ento, temos: U (44,17 ) 35,59 , logo a SQTr
5 5 1
correta fica igual a SQTr = 1289,00 35,59 = 1253,41 e a QMTr = 313,35.
Fc = 9,93. Como o valor de Fc F( 4 ,11: 0 ,05 ) a concluso sobre a presena
de pelo menos um efeito de tratamento no nulo, continua valendo.
OBS: Muitas vezes, dispensa-se o uso dessa correo, j que nem
sempre ela altera os resultados. Entretanto, na dvida, devemos aplicar
essa correo.
Fazendo esta mesma anlise no MiniTab, com asterisco no lugar da
parcela perdida temos o seguinte resultado
General Linear Model: Y versus Bloco; Trat
Factor Type Levels Values
Bloco fixed 41234
Trat fixed 5ABCDE

Analysis of Variance for Y, using Adjusted SS for Tests


Source DF Seq SS Adj SS Adj MS F P
Bloco 3 333.40 400.48 133.49 4.23 0.032
Trat 4 1253.42 1253.42 313.35 9.93 0.001
Error 11 347.18 347.18 31.56
Total 18 1934.00

Reparem que a SQTr j esta corrigida, ou seja, quando se usa o


MiniTab ou o SAS no necessrio estimar a parcela e depois substitu-la nos
dados e fazer a ANOVA. Nestes programas a correo da SQTr feita
automaticamente. No MiniTab necessrio seguir os seguintes passos:
Stat/ANOVA/General Linear Models e nesta janela colocar os
termos do modelo em Model na ordem apresentada.

Estatstica Experimental
103

Antes de acionar o OK nesta janela v janela General Model


Options marcar na Sum of Square a opo Adjusted (Type III) e
OK

13 Anlise de varincia de medidas repetidas


Um delineamento experimental de medidas repetidas aquele, no qual
vrias medidas so feitas na mesma unidade experimental (geralmente
animal), e estas medidas repetidas constituem as repeties. Para ilustrar
melhor esta caracterstica vamos considerar o exemplo 2, item 11 da Aula 3 ,
pg 38. Neste exemplo tnhamos 4 amostras independentes de animais e todos
os animais de cada grupo foram alimentados, depois do sorteio, com uma das
4 dietas. Nos delineamentos de medidas repetidas no existe amostras
independentes de animais, ao contrrio, cada um dos 5 animais tero seus
pesos medidos depois que foram submetidos a uma determinada dieta, depois
de um certo perodo de tempo, os mesmos cinco animais tero seus pesos
avaliados depois de terem sidos submetidos a outra dieta, e assim
sucessivamente, at serem submetidos a todas as dietas. A tabulao dos
dados pode ser bem parecida com a representao dos dados do DBC. Neste
exemplo podemos ter:

Dietas
Animais 1 2 3 4 Total
1 Y11 Y12 Y13 Y14 Y1+
2 Y21 Y22 Y23 Y24 Y2+
3 Y31 Y32 Y33 Y34 Y3+
4 Y41 Y42 Y43 Y44 Y4+
5 Y51 Y52 Y53 Y54 Y5+
Total Y+1 Y+2 Y+3 Y+4 Y++

Os resultados dos clculos da ANOVA de um delineamento de medidas


repetidas so os mesmos de uma anlise de um DBC. A grande vantagem
deste tipo de delineamento o seu econmico requerimento de unidades
experimentais (animais). Este delineamento tem desvantagens se existe um
efeito por causa da seqncia em que os tratamentos so administrados
(dietas no presente exemplo) aos animais. Outra desvantagem surge se o
tempo entre a aplicao de diferentes tratamentos insuficiente para evitar a
sobreposio de efeitos do tratamento anterior.

Estatstica Experimental
104

Exemplo 3 Considere o conjunto de dados abaixo os quais se referem a nveis


de concentrao de colesterol (mg/dl) em sangue de 7 animais experimentais,
depois que foram tratados cada um com uma das trs drogas, com suficiente
tempo entre as aplicaes das drogas para que seu efeito desaparecesse do
animal.
Drogas
Animal A B C Total
1 164 152 178 494
2 202 181 222 605
3 143 136 132 411
4 210 194 216 620
5 228 219 245 692
6 173 159 182 514
7 161 157 165 483
Total 1281 1198 1340 3819
A hiptese de interesse que a mdia do nvel de colesterol no sangue
a mesma independente da droga (tratamento). (Extrado de ZAR, J. H.
Biostatistical Analysis, pg. 255, 1999)
H 0 : 1 2 3
H1 : pelo menos duas mdias diferentes
Script no R para obter os resultados do exemplo 3
Analysis of Variance for N_C, using Sequential SS for Tests

Source DF Seq SS Adj SS Seq MS F P


Animal 6 18731.2 18731.2 3121.9 53.88 0.000
Droga 2 1454.0 1454.0 727.0 12.55 0.001
Error 12 695.3 695.3 57.9
Total 20 20880.6

Concluso: rejeita-se H0
# removendo todos os objetos definidos anteriormente
rm(list=ls(all=TRUE))

# Entrando com os dados pelo comando read.table( )


dados.ex3 <- read.table("ex3dbc.txt",h=T)
head(dados.ex3)

# anexando o objeto dados.ex3 no caminho de procura


attach(dados.ex3)

# definindo o objeto animal como um fator


animal<-factor(animal)

# quadro da anova pela funo aov( )


colesterol.av <- aov(colesterol~animal+droga)
summary(colesterol.av)

model.tables(colesterol.av)

residuos<-resid(colesterol.av)
residuos

qqnorm(resduos,pch=16,col=1)

Estatstica Experimental
105

qqline(residuos,lwd=2,col=2)

shapiro.test(residuos)

bartlett.test(colesterol~animal+droga)

Utilizando os recursos do pacote agricolae

# requerendo o pacote agricolae


require(agricolae)

colesterol.tu<- HSD.test(colesterol.av ,"droga")


colesterol.tu

# grfico de barras das mdias com o desvio padro pelo agricolae


bar.err(colesterol.tu ,ylim=c(0,250),std=TRUE,density=10,
col="brown",main="Mdia +/- Desvio Padro")
bar.err(colesterol.tu,ylim=c(0,250),std=FALSE,density=2,col="brown",mai
n="Mdia +/- erro padro")

# grfico de barras das mdias com o erro padro pelo agricolae


bar.group(colesterol.tu,ylim=c(0,250),std=FALSE,density=2,
col="brown", xlab="Drogas",main="Teste de Tukey")

Utilizando os recursos do pacote ExpDes


# requerendo o pacote ExpDes
require(ExpDes)

# anova pelo ExpDes


rbd(droga,animal,colesterol,quali=T,mcomp="tukey")

# retirando o objeto dados.ex3 do caminho de procura


detach(dados.ex3)

Estatstica Experimental
106

6 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL


1 - Contagens mdias de linfcitos de clulas de ratos (1000/mm3) foram comparadas dando
uma de duas drogas ou um placebo (controle). Ninhadas de ratos do mesmo sexo foram
usadas para formar blocos homogneos de 3 ratos cada; dentro de cada bloco, 3 tratamentos
foram sorteados ao acaso. Parece razovel assumir que os efeitos dos trs tratamentos deve
ser relativamente constante para vrios gentipos de ratos para diferentes ninhadas.
Blocos
Tratamentos I II III IV V VI VII
Placebo 5,4 4,0 7,0 5,8 3,5 7,6 5,5
Droga 1 6,0 4,8 6,9 6,4 5,5 9,0 6,8
Droga 2 5,1 3,9 6,5 5,6 3,9 7,0 5,4
a) Escrever o modelo matemtico deste experimento e estabelecer as hipteses
estatsticas H0 e H1 para testar os efeitos dos tratamentos.
b) Montar o quadro da anlise de varincia para testar as hipteses do item a).
c) Fazer o grfico de barras das mdias dos tratamentos com o desvio padro.
d) Calcular as mdias dos tratamentos e o erro padro das mdias com base na varincia
conjunta do experimento (QMR da ANOVA).
e) Faa um grfico dos itens c) e d).
f) Verificar pelo teste de Dunnett se os efeitos de cada droga diferem do controle (trat1).
g) Calcular os coeficientes de variao (CV) e de determinao (R2.) do experimento.

2- A Tabela abaixo mostra os dados da produo de leite, de vacas da raa Gir, filhas de 3
touros, na 1, 2 e 3 paries, em 305 dias de lactao, delineados segundo um DBC. com
amostragem na parcela.
Touros Paries (Blocos) Total
I II III
1 1750 1650 1600 2250 2200 2220 2400 2650 2610 19330
2 1250 1150 1120 1750 1600 1350 1800 1900 1710 13630
3 1600 1700 1900 2300 2400 2200 2700 2750 2680 20230
Total 13720 18270 21200 53190
Pede-se:
a) Escrever o modelo matemtico deste experimento e estabelecer as hipteses estatsticas H0
e H1
b) Montar o quadro da anlise de varincia e testar as hipteses do item a).
c) Calcular as mdias dos tratamentos e o erro padro das mdias com base na varincia
comum (QMR da ANOVA).
d) Fazer o grfico de barras das mdias dos tratamentos com o erro padro.
e) Verificar, pelo teste de Tukey, se existem diferenas entre as mdias dos touros.
f) Calcular o coeficiente de variao e de determinao do experimento R2 do experimento.

3 - Num experimento objetivando verificar a influncia da suplementao concentrada de


enzimas amilolticas, celulolticas e proeolticas sobre o ganho de peso em ovinos da raa ideal
(POLWARTH), criados a pasto, foram utilizados os seguintes tratamentos:
1 - Pasto de Cynodon dactylon + rao concentrada
2 - Pasto de Cynodon dactylon + rao concentrada + BIOVITASE
3 - Pasto de Cynodon dactylon + rao concentrada + PANASE-S
4 - Pasto de Cynodon dactylon ( Testemunha)
O experimento foi em blocos ao acaso, com 5 blocos e 4 tratamentos, e os resultados
obtidos para o ganho de peso mdio, em kg, durante o experimento foram:
Blocos
Tratamentos I II III IV V
1- Cynodon dactilon (testemunha) 6,10 5,80 3,60 5,30 6,30
2- Rao Concentrada (RC) 10,90 13,75 14,50 11,70 13,10
3- RC + BIOVITASE 11,70 16,28 14,40 15,50 11,60
4- RC + PANASE-S 16,80 14,10 8,60 16,10 14,30
Pede-se:

Estatstica Experimental
107

a) Estabelecer as hipteses estatsticas H0 e H1


b) Montar o quadro da anlise de varincia e testar as hipteses do item a).
c) Calcular as mdias dos tratamentos e erros padres das mdias.
d) Use o teste de Dunnett para testar os tratamentos que diferem da testemunha (RC).
e) Definir 3 contrastes ortogonais de interesse entre as mdias dos tratamentos e test-los
atravs da anlise de varincia. (decomposio dos graus de liberdade).
f) Calcular os coeficientes de variao e de determinao do experimento.

4 - Num experimento estudou-se o efeito do farelo de arroz desengordurado (FAD) ) como


fatores de retardamento da maturidade sexual de frangas. O ensaio, organizado em blocos
completos casualizados, abrangeu duas fases distintas e foi constitudo de 5 tratamentos e 5
repeties com 8 aves por unidade experimental.
A 1 fase iniciada quando as aves atingiram 9 semanas de idade, teve durao de 12 semanas.
As pesagens eram efetuadas com intervalos de duas semanas, e o consumo de rao era
registrado tambm com intervalo de duas semanas.
Os tratamentos, na 1 fase eram formados por raes que continham 0, 15, 30, 45, 60 % de
FAD em substituio ao milho. Os resultados obtidos na 1 fase do ensaio, para converso
alimentar foram os seguintes:
Tratamentos 1 Bloco 2 Bloco 3 Bloco 4 Bloco 5 Bloco
A - 0% de FAD 6,5 6,4 6,2 5,8 7,3
B - 15% de FAD 7,1 7,4 6,9 7,3 7,0
C - 30% de FAD 7,5 8,1 6,7 7,4 7,7
D - 45% de FAD 8,4 8,5 8,7 8,3 7,9
E - 60% de FAD 9,3 9,9 9,5 8,5 8,9
Fazer a anlise de varincia e caso haja significncia entre os tratamentos fazer a
decomposio dos graus de liberdade dos tratamentos por meio da tcnica dos polinmios
ortogonais (regresso linear, quadrtica, etc.). Ajuste a equao de regresso linear s mdias
dos tratamentos.

5 - No estudo do ganho de peso de porcos guinea, quatro dietas foram testadas. Vinte animais
foram usados neste experimento, 5 animais para cada dieta. Entretanto o pesquisador
acreditou que alguns fatores ambientais podem afetar o ganho de peso. No foi possvel reunir
os 20 animais em uma mesma condio ambiental. Portanto, foram estabelecidos 5 blocos de
unidades experimentais sob idnticas condies de temperatura, luz, etc.
Dietas
Blocos 1 2 3 4
1 7,0 5,3 4,9 8,8
2 9,9 5,7 7,6 8,9
3 8,5 4,7 5,5 8,1
4 5,1 3,5 2,8 3,3
5 10,3 7,7 8,4 9,1
a) Estabelecer as hipteses estatsticas H0 e H1
b) Montar o quadro da anlise de varincia e testar as hipteses do item a).
c) Fazer o grfico de barras das mdias dos tratamentos com o erro padro.
d) Verificar, pelo teste de Tukey, se existem diferenas entre as mdias das dietas. Qual foi a
dieta que proporcionou o melhor ganho de peso?
e) Calcular o coeficiente de variao e de determinao do experimento R2 do experimento.

6- Os resultados apresentados pelo programa R a uma anlise de dados de um experimento


foram:
Response: dados
Df Sum Sq Mean Sq F value Pr(>F)
blocos 3 37.35 12.45 2.7978 0.08549 .
tratamentos 4 2530.20 632.55 142.1461 5.361e-10 ***
Residuals 12 53.40 4.45
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Estatstica Experimental
108

a) Interprete estes resultados


b) As mdias dos tratamentos so apresentadas abaixo:
Trat A Trat B Trat C Trat D Trat E
12.75 23.50 37.00 45.00 34.50

Analisando os resultados da sada do Teste de Tukey preencha a tabela abaixo com as mdias
seguidas das letras.
$tratamentos
diff lwr upr p adj
Trat B-Trat A 10.75 5.995488 15.504512 0.0000864
Trat C-Trat A 24.25 19.495488 29.004512 0.0000000
Trat D-Trat A 32.25 27.495488 37.004512 0.0000000
Trat E-Trat A 21.75 16.995488 26.504512 0.0000000
Trat C-Trat B 13.50 8.745488 18.254512 0.0000085
Trat D-Trat B 21.50 16.745488 26.254512 0.0000001
Trat E-Trat B 11.00 6.245488 15.754512 0.0000689
Trat D-Trat C 8.00 3.245488 12.754512 0.0012997
Trat E-Trat C -2.50 -7.254512 2.254512 0.4820549
Trat E-Trat D -10.50 -15.254512 -5.745488 0.0001086

Tratamentos Mdias

Estatstica Experimental
109

Aula 7 Delineamento Quadrado Latino (DQL).


1 Introduo
No delineamento Quadrado Latino os tratamentos so designados aos
blocos de duas maneiras diferentes, geralmente designados por colunas e
linhas. Cada coluna e cada linha um bloco completo de todos os tratamentos.
Portanto, em um DQL, trs fontes de variao explicveis so identificveis:
linhas, colunas e tratamentos. Um particular tratamento designado somente
uma vez em cada linha e cada coluna. Geralmente um dos blocos corresponde
aos animais e o outro ao perodo. Cada animal receber todos os tratamentos
em diferentes perodos. O nmero de tratamentos (k) igual ao nmero de
linhas e colunas. O nmero total de observaes igual k2. Se os tratamentos
so designados por letras maisculas (A, B, C e D, etc.), ento exemplos de
Quadrados Latinos 3 x 3 e 4 x 4 so:
ACB CAB ABDC CDBA
BAC ABC CABD DBAC
CBA BCA BDCA BACD
DCAB ACDB
Considere a seguinte situao (baseado em VIEIRA, 2006, pg. 18): Um
veterinrio pretende comparar o efeito de trs drogas no combate a uma
doena em sunos. Os animais disponveis so, no entanto, diferentes em
raas e em pesos. Para fazer o experimento, o veterinrio deve, primeiro
organizar blocos de animais de mesma raa (em coluna) e depois organizar em
peso (em linha). Na Figura abaixo: a raa est representada pela tonalidade da
cor preta e o peso pelo tamanho. Ento foram construdos blocos em colunas
e linhas

Construdo o quadrado latino, sorteiam-se os tratamentos, mas cada


tratamento s deve aparecer uma vez em cada coluna e uma vez em cada
linha. Assim o sorteio dos tratamentos tem duas restries: dentro de linhas
e dentro de colunas

Os DQL no so comuns na prtica devido s restries do


delineamento. Notem, por exemplo, que linhas, colunas e tratamentos so,
necessariamente, iguais em nmeros. Mais ainda, o n de observaes igual
ao quadrado do n de tratamentos.
Considere este outro exemplo, extrado de Rao, P.V. Statistical research
methods in the life science, pg 727: Em um estudo para comparar as
tolerncias de gatos a quatro substncias cardacas (A, B, C, D) foi conduzida

Estatstica Experimental
110

utilizando-se um DQL, no qual as linhas representavam quatro combinaes de


dois perodos (A.M. , P.M.) e duas tcnicas (I e II) e as colunas representam os
dias nos quais as medidas foram feitas. A cada um dos 16 gatos foi
administrada uma substncia cardaca a uma taxa fixada e a dose (taxa de
infuso x tempo) na qual o efeito especificado foi observado foi anotado.
Abaixo temos que mostra as respostas medidas em 10log(dose em g).
Dias
1 2 3 4
Yi.. Yi
I,AM
Y11(D ) Y12(B ) Y13(A ) Y14(C ) Y1 Y1
3,26 4,15 3,02 3,67 14,10

Combinaes
I,PM
Y21(B ) Y 22(D ) Y 23(C ) Y 24(A ) Y2 Y2
de tempo e 2,73 3,38 3,29 4,50
tcnicas
13,90
II,AM Y31(A ) Y32(C ) Y33(B ) Y 34(D ) Y3 Y3
3,45 4,09 2,66 3,51 13,71
II,PM
Y 41(C ) Y 42(A ) Y 43(D ) Y 44(B ) Y 4 Y 4
3,20 3,14 3,48 3,40 13,22

Y j Y 1 Y 2 Y 3 Y 4 Y
12,64 14,76 12,45 15,08 54,93
Y j Y1 Y2 Y3 Y4 Y

Totais dos tratamentos:


Y (A )Y13(A ) Y24(A )
Y31(A )
Y 42(A ) 3,02 4,50 3,45 3,14 14,11
Y (B )Y12(B ) Y21(B )
Y33(B )Y 44(B )
4,15 2,73 2,66 3,40 12,94
Y (C )Y14(C ) Y23(C )
Y32(C )
Y 41(C ) 3,67 3,29 4,09 3,20 14,25
Y (D )Y11(D ) Y22(D )
Y34(D )Y 43(D ) 3,26 3,38 3,51 3,48 13,63
Notao:
Yi = soma das observaes da i-sima linha (i = 1, 2,..., k);

Yi = soma das observaes da j-sima coluna (j=1,2, ..., k);
Y ( t ) = soma das observaes do t-simo tratamento
Organizao dos arquivos:
No excel: ex1.xls No bloco de notas: ex1.txt
Linha coluna trat tx.inf linha coluna trat tx.Inf
TI_AM DIA1 D 3.26 TI_AM DIA1 D 3,26
TI_AM DIA2 B 4.15 TI_AM DIA2 B 4,15
TI_AM DIA3 A 3.02 TI_AM DIA3 A 3,02
TI_AM DIA4 C 3.67 TI_AM DIA4 C 3,67
TI_PM DIA1 B 2.73 TI_PM DIA1 B 2,73
TI_PM DIA2 D 3.38 TI_PM DIA2 D 3,38
TI_PM DIA3 C 3.29 TI_PM DIA3 C 3,29
TI_PM DIA4 A 4.50 TI_PM DIA4 A 4,50
TII_AM DIA1 A 3.45 TII_AM DIA1 A 3,45
TII_AM DIA2 C 4.09
TII_AM DIA2 C 4,09
TII_AM DIA3 B 2.66
TII_AM DIA3 B 2,66
TII_AM DIA4 D 3.51
TII_AM DIA4 D 3,51
TII_PM DIA1 C 3.20
TII_PM DIA1 C 3,20
TII_PM DIA2 A 3.14
TII_PM DIA3 D 3.48
TII_PM DIA2 A 3,14
TII_PM DIA4 B 3.40 TII_PM DIA3 D 3,48
TII_PM DIA4 B 3,40

2 Modelo matemtico

Estatstica Experimental
111

Y ijt Li C j k ijt i 1, 2,, k e j 1, 2, , k ,


t o indice de identificao do tratamento usado
na i sima linha e j sima coluna
sendo:
y ijk a observao que recebeu o k simo tratamento, na i sima linha
e na j sima coluna ;
mdia geral comum a todas as observaes ;
L j o efeito da i sima linha;
C j efeito da j sima coluna;
t efeito fixo do t simo tratamento , e t t 0;
ijt o efeito do erro aleatrio.

3 Suposies do modelo
Neste modelo, supem-se que:
Lj so independentes N(0, L2 );
C j so independentes N(0,C2 )
;
it so independentes N(0, 2 )
ijt , Li , e C j so mutuamente independentes.

4 Hiptese estatstica
Podemos testar
H 0 : t 0, H 0 : 1 2 ... t
, ou
H 1 : nem todos os t 0 H 1 : i j para i j
Geralmente os testes de hipteses com relao aos efeitos de linhas e
colunas no so feitos por dois motivos: primeiro o interesse principal testar
os efeitos de tratamento, e o propsito usual de linhas e colunas eliminar
fontes estranhas de variao.

5 Participao da soma de quadrados


Do quadro de representao das observaes no DQL, podemos notar os
seguintes desvios:
Podemos identificar os seguintes desvios:
y ijt y , como o desvio de uma observao em relao mdia
geral;
y ijt y , como o desvio da mdia do t-simo tratamento em
relao mdia geral;
y i y , como o desvio da mdia da i-simo linha em relao
mdia geral;
y j y como o desvio da mdia da j-sima coluna em relao
mdia geral;
Ento, podemos escrever a igualdade:
(Y ijt Y )
(Yi Y )
(Y j Y )
(Y t Y )
(Yijt Yi Y. j Yij 2Y )
a
qual representa a a variao de uma observao em relao mdia geral

Estatstica Experimental
112

amostral como uma soma da variao da mdia da i-sima linha em relao


mdia geral, com a variao da mdia da j-sima coluna em relao mdia
geral, com a variao da mdia da j-sima coluna em relao mdia geral,
com a variao da mdia do k-sima tratamento em relao mdia geral, e
com a variao do erro experimental . Elevando-se ao quadrado os dois
membros da identidade acima e somando em relao aos ndices i e j,
obtemos:
k k k k k


i j
1
(Y ijk Y
1

2
) (Y i Y )
i 1
2
(Y j Y )
j 1
2
(Y k Y )
t 1
2

k k k
(Y ijk Y i Y. j Y ij 2Y )
2
,
i 1 j 1 t 1

ou seja, a Soma de Quadrados do Total (SQT) igual Soma de Quadrados


do efeito colocado nas linhas (SQL), mais a Soma de Quadrados do efeito
colocado nas colunas (SQC), mais a Soma de Quadrados dos Tratamentos
(SQTr), mais a Soma de Quadrados dos resduos (SQR). Notem que existem
k2 observaes, ento a SQT tem (k2 -1) graus de liberdade. Existe k linhas, k
colunas e k tratamentos, tal que cada uma das trs soma de quadrados
SQL, SQC e SQTr tem k-1 graus de liberdade. Finalmente, os graus de
liberdade para SQR pode ser calculado pela diferena entre os graus de
liberdade entre a SQT e soma dos graus de liberdade para linhas, colunas e
tratamentos. ((k2-1)-(k-1)-k-1)-(k-1)=(k-1)(k-2)).
Assim, os graus de liberdade associados a cada membro da equao
acima fica:
Total Linhas Colunas Tratamentos Resduo
( k2 -1) = (k-1) + (k-1) + (k-1) + (k-1)(k-2)

6 Quadrados mdios
Dividindo a SQL, SQC, SQTr e SQR pelos correspondentes graus de
liberdade, obtemos, respectivamente o Quadrado Mdio das Linhas (QML), o
Quadrado Mdio das Colunas (QMC) , o Quadrado Mdio de Tratamentos
(QMTr) e o Quadrado Mdio Resduo (QMR), isto ,
SQL SQC SQTr SQR
QML , QMC e QMTr e QMR
k 1 k 1 k 1 (k 1)(k 2 )
7 Estatstica e regio crtica do teste
A estatstica para o teste
QMTr
Fc ,
QMR
a qual, deve ser prximo de 1 se H0 for verdadeira, enquanto que valores
grandes dessa estatstica so uma indicao de que H0 falsa. A teoria nos
assegura que Fc tem, sob H0 distribuio F Snedecor com (k -1) e (k-1)(k-2)
graus de liberdade no numerador e no denominador, respectivamente.
Resumidamente, indicamos:
Fc ~ F(k 1(
, k 1)(k 2 ), ) , sob H 0 .
Rejeitamos H0 para o nvel de significncia se
Fc F( k 1 ,( k 1 )( k 2 ), ) ,
sendo, F( k 1 , ( k 1 )( k 2 ), ) o quantil de ordem (1 ) da distribuio F-Snedecor
com (k -1) e (k-1)(k-2) graus de liberdade no numerador e no denominador.

Estatstica Experimental
113

8 Quadro da anlise de varincia (ANOVA)


Dispomos as expresses necessrias ao teste na Tabela abaixo,
denominada de Quadro de Anlise de Varincia (ANOVA).
Fonte de variao gl SQ QM F

Y i 2 (Y )
k 2
SQL
Linhas k-1
i 1 k

k2 k 1
k Y 2j (Y )
2 SQC
Colunas k1
j 1 k

k2 k 1

Y 2t (Y )
k 2
SQTr QMTr
Tratamentos k-1
t 1 r

k2 k 1 QMR
SQR
Resduo (k-1)(k-2)
(k 1)(k 2 )

k k
(Y )
2

TOTAL 2
K 1 Yijt2
i 1 J 1 k2
Pode-se provar que:
E( QMR ) 2 , ou seja, QMR um estimador no viesado da
varincia 2 ;
r k
E(QMTr ) 2 i , ou seja, QMTr um estimador no
(k 1)i 1
viesado da varincia 2 se a hiptese H0 : 1 2 ... k 0
verdadeira.

9 Detalhes computacionais
Apresentaremos alguns passos que facilitam os clculos das somas de
quadrados da ANOVA.
( y )2
Calcule a correo para a mdia CM 2 ;
k
Calcule a Soma de Quadrados dos Totais (SQT)
k k
SQT y ijt2 CM ;
i 1 j 1

Calcule a Soma de Quadrados Entre os Tratamentos (SQTr)


k
Y2
SQTr t CM ;
t 1 k
Calcule a Soma de Quadrados das Linhas (SQL)
k
Y2
SQL i CM ;
j 1 k

Calcule a Soma de Quadrados de Colunas (SQC)


Y 2j
k
SQC CM ;
j 1 k

Estatstica Experimental
114

Calcule a Soma de Quadrados Residual (SQR) pela diferena, isto


, SQR SQT SQL SQC SQTr ;
Calcule os Quadrados Mdios Entre os Tratamentos (QMTr) e o
Quadrado Mdio Residual (QMR)
SQL SQC SQTr SQR
QML , QMC , QMTr e QMR
k 1 k 1 k 1 (k 1)(k 2 )
Calcule Fc para tratamentos, linhas e colunas, ou seja,
QMTr QML QMC
FcTr , FL e FC
QMR QMR QMR
10 Exemplo 1: Vamos considerar os dados do exemplo apresentado no item1.
Os clculos para montar-mos o quadro da ANOVA so:
k = 4, e k2 = N =16. Ento
Graus de liberdade:
Total k 2 1 N 1 16 1 15; Trat . k 1 4 1 3
Linhas k 1 4 1 3 , Colunas k 1 4 1 3 e
Re s ( k 1 )( k 2 ) ( 4 )( 2 ) 8
2
(54,94 )
CM 188,5816
16
SQT (3,26 ) 2
(4,15 ) 2
... (3,40 )2
CM

192,1871 188,5816 3,6055
2 2 2 2
(14,11) (12,94 ) (14,25 ) (13,63 )
SQTr CM
4 4 4 4
188,8147 188,5816 0,2331
2 2 2 2
(14,10 ) (13,90 ) (13,71) (13,22 )
SQL CM
4 4 4 4
188,6881 188,5816 0,1065
2 2 2 2
(12,64 ) (14,76 ) (12,45 ) (15,08 )
SQC CM
4 4 4 4
190,0090 188,5816 1,4274
SQR SQT SQTr SQL SQC 3,6055 0,2331 0,1065 1,4274 1,8384

0,2331 0,1065 1,4274


QMTr 0,0771 , QML 0,0355 , QMC 0,4758
3 3 3
1,8094
e QMR 0,3015
6
QMTr 0,08741 QML 0,0355
FcTr 0,2899 e FcL 0,1159
QMR 0,3064 QMR 0,3016
QMC 0,4758
FcC 1,5530
QMR 0,3064

Organizando estes resultados no Quadro da ANOVA, temos:

Estatstica Experimental
115

Fonte de variao gl SQ QM F

Linhas 3 0,1065 0,0355


Colunas 3 1,4274 0,4758
Tratamentos 3 0,2331 0,08741 0,2899
Resduo 6 1,8384 0,3015
TOTAL 15 3,6055

Das tabelas das distribuies F, temos que


F( 3 ,6 , 0 ,05 ) 4 ,76 e F( 3 ,6 , 0 ,01 ) 9,78 . O valor FcTr = 0,2899 menor do que estes
valores tabelados, ento no rejeitamos a hiptese nula H0 para um nvel
0 ,05 , ou 5% de probabilidade e conclumos que os dados no evidenciam
uma diferena significativa entre as quatros drogas. Os dados tambm no
evidenciam uma variao significativa entre os efeitos colocados nas linhas
(p=0,946) e nas colunas (p=0,290). Seguindo o que alguns pesquisadores
sugerem no consideraramos os efeitos de linhas e colunas em futuros
experimentos, tendo em vista que o valor do nvel de significncia para linhas e
colunas superior a 0,25.
Script no R para a obteno dos resultados acima
# entrando com os dados pelo comando read.table( )
dados.ex1 <- read.table("ex1dql.txt",header=TRUE,dec=",")

# imprimindo as 6 primeiras linhas do arquivo


head(dados.ex1)

# anexando o objeto dados.ex1 no caminho de procura


attach(dados. ex1)

# estatsticas resumo de cada nvel dos tratamentos


e.desc<- tapply(tx.inf,trat,summary)
e.desc

# tornando linha coluna e tratamentos como fatores


linha<- factor(linha); coluna<- factor(coluna); trat <- factor(trat)

# grfico Box-plot para cada nvel de trat


boxplot(tx.inf~trat,col=2,xlab="Tratamentos")

# quadro da anova
tx.inf.av<-aov(tx.inf~linha+coluna+trat)
summary(tx.inf)

# obtendo o residuo
residuo <- resid(tx.inf.av)

# teste de normalidade dos resduos


shapiro.test(residuo)

# teste de homogeneidade das varincias


bartlett.test(tx.inf~linha+coluna+trat)

Estatstica Experimental
116

Utilizando os recursos do pacote ExpDes


# requerendo o pacote ExpDes
require(ExpDes)

# quadro da anova pelo ExpDes


latsd(trat,linha,coluna,tx.inf,quali=T)

# retirando o objeto dados.ex1 do camnho de procura


detach(dados.ex1)

Exemplo 2. Com o objetivo de estudar o efeito da idade da castrao no


desenvolvimento e produo de sunos, foi utilizado um delineamento em
quadrado latino com 4 tratamentos envolvendo a castrao aos 7 dias (C); aos
21 dias (D); aos 56 dias (A) e sunos inteiros (B). A variao existente entre as
leitegadas foi controlada pelas linhas do quadrado e a variao dos pesos dos
leites dentro das leitegadas foi isolada pelas colunas. Os ganhos de peso, em
kg, ao final do experimento (252 dias) esto apresentados no quadro a seguir:

Leitegada Classe de pesos dos leites dentro das leitegadas


1 2 3 4 Totais
1 93,0 (A) 108,6 (B) 118,9 (C) 102 (D) 412,5
2 115,4 (B) 96,5 (D) 77,9 (A) 120,2 (C) 390,0
3 122,1 (C) 90,9 (A) 116,9 (D) 106,0 (B) 409,9
4 117,6 (D) 124,1 (C) 118,7 (B) 95,6 (A) 448,0
Totais 428,1 414,1 422,4 395,8 1660,4

Quadro da ANOVA
Fonte de variao gl SQ QM F
Leitegadas 3 436,55 49,65 0,72
Classe 3 148,95 145,52 2,11
Tratamentos 3 913,57 304,52 4,42
Resduo 6 413,00 68,83

TOTAL 15 1912,07

Das tabelas das distribuies F, temos que


F( 3 ,6 , 0 ,05 ) 4 ,76 e F( 3 ,6 , 0 ,01 ) 9,78 . O valor FcTr = 4,42 menor do que estes
valores tabelados, ento no rejeitamos a hiptese nula H0 para um nvel
0 ,05 , ou 5% de probabilidade e conclumos que a hiptese de que os
efeitos de tratamento so todos nulos no rejeitada, ou seja, os ganhos de
peso dos leites submetidos s diferentes idades de castrao so todos iguais
a 103,78.
Script no R para a obteno destes resultados
# leitura dos dados pelo read.table
dados.ex2 <- read.table("ex2dql.txt",header=TRUE)
# imprimindo as 6 linhas iniciais do arquivo
head(dados.ex2)

# anexando o objeto dados.ex3 no caminho de procura

Estatstica Experimental
117

attach(dados.ex2)

# estatsticas resumo dos dados do arquivo dados.ex2


e.desc<- tapply(peso,trat,summary)
e.desc

# grfico Box-plot para cada nvel de trat


boxplot(peso~trat,col=2,xlab="Tratamentos")

# fazendo a anlise diretamente pelo ExpDes


# requerendo o ExpDes
require(ExpDes)

# quadro da anova
latsd(trat,leitegada,classe,peso,quali=T,mcomp="tukey")

# retirando o objeto dados.ex2 do caminho de procura


detach(dados.ex2)

11 Como contornar o problema do pequeno nmero de graus de liberdade


do resduo?
Um problema que surge quando usamos o delineamento em quadrado
latino com um nmero pequeno de tratamentos, que o resduo passa a ser
estimado com um nmero pequeno de graus de liberdade. No quadro a seguir,
apresentamos o nmero de graus de liberdade do resduo no DQL para
diferentes nmeros de tratamentos:
Nmero de tratamentos g.l. do resduo
3 2
4 6
5 12
6 20
7 30
8 42

RESPOSTA: Planejar mais de uma repetio do quadrado latino para


conseguir um nmero satisfatrio de graus de liberdade para o resduo. Por
exemplo, se k = 4 tratamentos e queremos um nmero de g.l. para o resduo
superior a 12, devemos fazer pelo menos r = 2 repeties do Q.L. original.
Soluo 1: usar as mesmas linhas e mesmas colunas;
QL1 C1 C2 C3 C4 QL2 C1 C2 C3 C4
L1 A B C D L1 D A B C
L2 B C D A L2 C D A B
L3 C D A B L3 B C D A
L4 D A B C L4 A B C D

Quadro da ANOVA resultante

Estatstica Experimental
118

Causas de variao gl
QL r1=1
Tratamentos k1=3
Linhas k1=3
Colunas k1=3
Resduo (k 1)[ r (k + 1) 3] = 21
Total r k2 1 = 31

Soluo 2: usar as mesmas linhas com as colunas diferentes (ou


mesmas colunas com linhas diferentes);
QL1 C1 C2 C3 C4 QL2 C5 C6 C7 C8
L1 A B C D L1 D A B C
L2 B C D A L2 C D A B
L3 C D A B L3 B C D A
L4 D A B C L4 A B C D

Quadro da ANOVA resultante


Causas de variao gl
QL r1=1
Tratamentos k1=3
Linhas k1=3
Colunas (QL) r(k1)=6
Resduo (k 1)(r k 2 )= 18
Total r k2 1 = 31

Soluo 3: usar linhas e colunas diferentes.


QL1 C1 C2 C3 C4 QL2 C5 C6 C7 C8
L1 A B C D L5 D A B C
L2 B C D A L6 C D A B
L3 C D A B L7 B C D A
L4 D A B C L8 A B C D

Quadro da ANOVA resultante


Causas de variao gl
QL r1=1
Tratamentos k1=3
Linhas (QL)* r ( k - 1) = 6
Colunas (QL)** r ( k - 1) = 6
Resduo (k 1) [ k (k 1) 1]=15
Total r k2 1 = 31
(*) l-se Efeito de linhas dentro de quadrado latino
(**) l-se Efeito de colunas dentro de quadrado latino

Suponha que um experimentador esteja interessado em estudar os


efeitos da atividade da estimulao hormonal folicular (follicle-stimulation
hormone - FSH). Em vacas medido em bio ensaios pesando-se o ovrio (mg)
de ratos imaturos. Duas variveis conhecidas que influenciam no peso de
ovrios de ratos so: a constituio gentica e o peso corporal. Acredita-se que
o peso corporal independente das diferenas genticas, assim o
delineamento quadrado latino (DQL) adequado. Dois quadrados latinos 4 x 4
foram usados com as linhas = ninhadas de ratos e colunas = classes de peso
corporal. O pesquisador considerou a diferena nos pesos corporais nos dois

Estatstica Experimental
119

quadrados para preservar os graus de liberdade do erro experimental, dado


que a amplitude do peso corporal era consistente de ninhada para ninhada, ou
seja, o pesquisador repetiu o experimento considerando as mesmas classes de
peso corporal.

(Soluo 2).
QL1 C1 C2 C3 C4 Totais QL2 C1 C2 C3 C4 Totais

L1 (D) 44 (C) 39 (B) 52 (A) 73 208 L5 (B) 51 (C) 74 (A) 74 (D) 82 281

L2 (B) 26 (A) 45 (D) 49 (C) 58 178 L6 (D) 62 (A) 74 (C) 75 (B) 79 290

L3 (C) 67 (D) 71 (A) 81 (B) 76 295 L7 (A) 71 (D) 67 (B) 60 (C) 74 272

L4 (A) 77 (B) 74 (C) 88 (D) 100 339 L8 (C) 49 (B) 47 (D) 58 (A) 68 222

Totais 214 229 270 307 1020 233 251 267 303 1065

Totais dos tratamentos: 563 (A), 465 (B), 524 (C), 533 (D)
Clculos:
2082 1782 ... 2222 (1020 1065)2
SQL 4891,69 ;
4 32
(214 233)2 ... (307 303)2 (1020 1065)2
SQC 1819,09;
8 32
5632 ... 5332 (1020 1065)2
SQTr 631,59;
8 32
(1020 1065)2
SQT 44 2 ... 68 2 7788,22;
32
SQR SQT SQTr SQC SQL 382,56;
O quadro da ANOVA fica
Causas de variao gl SQ QM F P
QL 1 63,28 63,28
Tratamentos 3 631,59 210,53 9,91 0,0004
Linhas (QL) 6 4891,69 815,28 38,26
Colunas 3 1819,09 606,36 28,53
Resduo 18 292 16,22
Total 31 7730
Das tabelas das distribuies F, temos que
F( 3 ,18 , 0 ,05 ) 3 ,16 e F( 6 , 18 , 0 ,01 ) 5 ,09 . O valor Fctr = 9,91 maior que estes
valores tabelados, ento rejeitamos a hiptese nula H0 para um nvel
0 ,01, ou1% de probabilidade e conclumos que a hiptese de que os
efeitos de tratamento so todos nulos rejeitada, ou seja, nos pesos dos
ovrios de ratos imaturos (bio-ensaio para vacas) existe pelo menos dois
tratamentos que diferem entre si quanto ao peso de ovrios.
Podemos usar o teste de Tukey para compararmos as mdias dos
tratamentos (note que temos 4 tratamentos e cada um deles aparece 8 vezes).
Ento,

QMR 21,25
d.m.s. q( 4, 18, 0,05) 3,997 6,51
rk 8

Estatstica Experimental
120

Peso mdio*
Drogas (mg)
A 70,37 a
D 66,63 a
C 65,50 a
B 58,13 b
(* Mdias seguidas pelas mesmas letras na coluna no diferem entre si pelo teste de Tukey a 5%).
Com base nos resultados apresentados na tabela anterior pode-se
afirmar que os pesos de ovrios tratados com as drogas A, D e C no diferem
entre si e os pesos dos ovrios tratados com as drogas C e B tambm no
diferem entre si. As diferenas nos pesos de ovrios esto entre as drogas A, D
e C quando comparadas, individualmente, com a droga B.
Organizando o arquivo de dados no Excel e no bloco de notas
Arquivo de dados .xls (peso.xls) Arquivo de dados . txt (peso.txt)
ql linha coluna trat put ql linha coluna trat put
q1 l1 c1 D 44
q1 l1 c1 D 44 q1 l2 c1 B 26
q1 l2 c1 B 26 q1 l3 c1 C 67
q1 l4 c1 A 77
q1 l3 c1 C 67
q1 l1 c2 C 39
q1 l4 c1 A 77 q1 l2 c2 A 45
q1 l1 c2 C 39 q1 l3 c2 D 71
q1 l4 c2 B 74
q1 l2 c2 A 45 q1 l1 c3 B 52
q1 l3 c2 D 71 q1 l2 c3 D 49
q1 l3 c3 A 81
q1 l4 c2 B 74
q1 l4 c3 C 88
q1 l1 c3 B 52 q1 l1 c4 A 73
q1 l2 c3 D 49 q1 l2 c4 C 58
q1 l3 c4 B 76
q1 l3 c3 A 81 q1 l4 c4 D 100
q1 l4 c3 C 88 q2 l5 c1 B 51
q1 l1 c4 A 73 q2 l6 c1 D 62
q2 l7 c1 A 71
q1 l2 c4 C 58 q2 l8 c1 C 49
q1 l3 c4 B 76 q2 l5 c2 C 74
q2 l6 c2 A 74
q1 l4 c4 D 100
q2 l7 c2 D 67
q2 l5 c1 B 51 q2 l8 c2 B 47
q2 l6 c1 D 62 q2 l5 c3 A 74
q2 l6 c3 C 75
q2 l7 c1 A 71 q2 l7 c3 B 60
q2 l8 c1 C 49 q2 l8 c3 D 58
q2 l5 c4 D 82
q2 l5 c2 C 74
q2 l6 c4 B 79
q2 l6 c2 A 74 q2 l7 c4 C 74
q2 l7 c2 D 67 q2 l8 c4 A 68
q2 l8 c2 B 47
q2 l5 c3 A 74
q2 l6 c3 C 75
q2 l7 c3 B 60
q2 l8 c3 D 58
q2 l5 c4 D 82
q2 l6 c4 B 79
q2 l7 c4 C 74
q2 l8 c4 A 68
Script no R para a obgteno dos resultados acima
# leitura dos dados pelo read.table
dados.ex3 <- read.table("ex2dql.txt",header=TRUE)

# imprimindo as 6 linhas iniciais do arquivo


head(dados.ex3)
# anexando o objeto dados.ex3 no caminho de procura

Estatstica Experimental
121

attach(dados.ex3)

# grfico Box-plot para cada nvel de trat


boxplot(peso~trat,col=2,xlab="Tratamentos")

# quadro da anova
put.av <-aov(put~ql+linha+coluna+trat)
anova(put.av)

# usando os recursos do pacote agricolae


require(agricolae)
put.tu <-HSD.test(put.av,"trat")

# grfico de barras com as letras do teste de Tukey


bar.group(put.tu,ylim=c(0,90),density=20,
col="brown", xlab="Tratamentos",ylab="Peso do Utero",
main="Teste de Tukey")

# retirando o objeto dados.ex3 do caminho de procura


detach(dados.ex3)

12 Casualizao dos tratamentos


Suponha que queremos dispor os tratamentos A, B, C, e D sobre um
quadrado latino 4 x 4
escolhemos aleatoriamente um dos quadrados padres de
tamanho 4. suponha
1 2 3 4
1 A B C D
2 B C D A
3 C D A B
4 D A B C
selecionemos uma das permutaes de 1, 2, 3, e 4. suponha 2, 4,
1, 3. ento
1 2 3 4
2 B C D A
4 D A B C
1 A B C D
3 C D A B
selecionemos uma outra das permutaes de 1, 2, 3, e 4. suponha
1, 3, 4, 2. ento
1 3 4 2
2 B D A C
4 D B C A
1 A C D B
3 C A B D
Este o delineamento escolhido.

13 Exemplos em qua as unidades experimentais so animais

Estatstica Experimental
122

Neste tipo de experimento os prprios animais servem como um critrio


de classificao (linhas) e o tempo (colunas) o outro, ou seja, medidas
repetidas no aleatrias so obtidas de cada animal (pessoa) distribudos a
uma seqncia de tratamentos.
Exemplo 4 O objetivo deste experimento foi testar o efeito de quatro diferentes
suplementos (A, B, C, D) adicionados ao feno na engorda de novilhos. O
experimento foi delineado em um experimento Quadrado Latino com quatro
animais em quatro perodos de 20 dias. As ovelhas foram mantidas isoladas
individualmente. Cada perodo consistia de 10 dias de adaptao e de 10 de
medidas. Os dados apresentados abaixo so as mdias de 10 dias.
Novilhos
Perodo N1 N2 N3 N4
1 10,0 (B) 10,2 (C) 8,5 (D) 11,8 (A)
2 9,0 (C) 11,3 (A) 11,2 (B) 11,4 (C)
3 11,1 (C) 11,2 (B) 12,8 (A) 11,7 (D)
4 10,8 (A) 11,0(D) 11,0 (C) 11,0 (B)
Script no R para resolver este exemplo
# leitura dos dados pelo read.table
dados.ex4 <- read.table("ex4dql.txt",header=TRUE)

# imprimindo as 6 linhas iniciais do arquivo


head(dados.ex4)

# anexando o objeto dados.ex4 no caminho de procura


attach(dados.ex4)

# estatsticas resumo dos tratamentos do arquivo dados.ex4


e.desc<- tapply(peso,trat,summary)
e.desc

# grfico Box-plot para cada nvel de trat


boxplot(peso~trat,col=2,xlab="Tratamentos")

# fazendo a anlise diretamente pelo ExpDes


# requerendo o ExpDes
require(ExpDes)

# quadro da anova
latsd(trat,periodo,novilho,peso,quali=T,mcomp="tukey")

# retirando o objeto dados.ex4 do caminho de procura


detach(dados.ex4)

RESUMO:

Estatstica Experimental
123

Estatstica Experimental
124

7 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL


1) Nos experimentos que tratam da produo de vacas leiteiras, a enorme variao entre os
indivduos exige um grande nmero de animais para a avaliao de diferenas moderadas.
Qualquer esforo de aplicar vrios tratamentos sucessivamente numa mesma vaca se complica
pela diminuio do fluxo de leite, pela forma da curva de lactao e por uma correlao entre
os erros eijk. Estas dificuldades so controladas com o uso de vrios pares de quadrados
latinos ortogonais onde as colunas representam as vacas e as linhas os perodos sucessivos
da lactao, e os tratamentos so aplicados as vacas nos vrios estgios. Num experimento
procurou-se verificar o efeito de diferentes tipos de tratamentos, e apresentado somente um
quadrado latino, sem nos preocuparmos com os efeitos correlacionados.
Os tratamentos (1,0 kg para cada 3,0 kg de leite produzido) foram os seguintes:
A = Rao comum
B = 75% de rao comum + 25% de rolo de milho.
C = 50% de rao comum + 50% de rolo de milho.
D = 75% de rao comum + 25% de farelo de soja.
E = 25% de rao comum + 75% de farelo de soja.
Os valores da tabela correspondem a produo de leite (kg) por um perodo de seis semanas.
Linhas Colunas (Vacas) Total
(Perodo) 1 2 3 4 5
1 B 318 E 416 A 420 C 424 D 330 1908
2 D 325 A 435 E 418 B 438 C 333 1949
3 E 342 B 441 C 395 D 418 A 380 1976
4 A 353 C 403 D 410 E 395 B 375 1936
5 C 310 D 381 B 422 A 432 E 314 1859
Total 1648 2076 2065 2107 1732 9628
a) Formule as hipteses estatsticas para os tratamentos e monte o quadro da anlise de
varincia de acordo com um delineamento quadrado latino e conclua
b) Aplique o teste de Tukey para localizar as diferenas entre as mdias dos tratamentos.
Represente as diferenas com as mdias (mdiase), seguidas de letras.
d) Teste a normalidade dos erros e a homogeneidade das varincias dos tratamentos.
e) Defina os contrastes abaixo e teste-os atravs da tcnica de decomposio dos graus de
liberdade dos tratamentos (teste F planejado) e complemente o quadro da anova do item b)
com estes contrastes:
c1) Existe efeito dos complementos adicionados rao comum?;
c2) Qual complemento adicionado rao comum melhor: rolo de milho ou farelo de
soja?;
c3) Qual percentual de rolo de milho melhor ?;
c4) Qual percentual de farelo de soja melhor ?;
f) Calcular e interpretar os coeficiente de variao (CV) do experimento e o de determinao R2
do experimento.
g) Com base nestas observaes e nos resultados do item a) a utilizao do delineamento em
DQL plenamente justificada?

Estatstica Experimental
125

2) Avaliao do efeito de anestsicos sobre o metabolismo animal imprescindvel ao


cirurgio. Neste experimento so considerados 5 anestsicos e analisar variveis como:
frequncia cardaca,respiratria, presso sangunea, tempo efetivo de anestesia. Estas
variveis so muito instveis com c.v. > 35,0 %. Existe uma reao muito diferente de animal
para animal o que exigiria um nmero muito grande destes ( de 13 a 49 animais) para cada
anestsico. Por outro lado estas respostas so de fluxo contnuo. Podemos testar todos os
anestsicos, em ocasies diferentes com intervalos de 2 a 3 dias, no mesmo animal. Se um
animal recebe todos os anestsicos, em sequncia controlada, todos os demais devero
tambm receb-los, mas cada um dos cachorros dever estar submetido a um anestsico
diferente, de modo que, em um mesmo dia, todos os ces e todos os anestsicos estejam
sendo testados. Com este procedimento, o eventual efeito de dia poder estar controlado.
A maneira mais simples de se controlar o efeito de dia de experimentao (ou perodo) e o
efeito de ces, o efeito de controle local (blocos). Uma soluo prtica que leva em conta os
dois tipos de blocagem (perodo e animal) o croqui do delineamento quadrado latino (DQL)
onde as letras representam um anestsico especfico com os seguintes resultados sobre tempo
efetivo de anestesia:
Perodo
Animal I II III IV
1 A(4,92) E(4,77) B(7,29) D(9,99) C(6,93)
2 D(4,88) B(8,53) A(8,29) C(8,95) E(8,51)
3 C(7,32) A(6,16) E(8,50) B(5,83) D(7,08)
4 E(6,67) C(5,00) D(5,40) A(7,54) B(9,62)
5 B(5,40) D(7,15) C(8,95) E(7,85) A(9,68)
Aplique os mesmos itens da questo anterior.

Estatstica Experimental
126

Aula 8 Experimentos fatoriais


1 Introduo
Nos experimentos mais simples comparamos tratamentos ou nveis de
um nico fator, considerando que todos os demais fatores que possam interferir
nos resultados obtidos se mantenham constantes. Por exemplo: quando
comparamos tipos de drogas em animais experimentais, os demais fatores,
como raa, idade, sexo etc., se mantm constantes, isto , devem ser os
mesmos para todas as drogas estudadas. Entretanto, existem diversos casos
em que vrios fatores devem ser estudados simultaneamente. Nesses casos,
utilizamo-nos dos experimentos fatoriais, que so aqueles nos quais so
estudados, ao mesmo tempo, os efeitos de dois ou mais tipos de fatores ou
tratamentos. Entenda-se por fator uma varivel independente cujos valores
(nveis do fator) so controlados pelo experimentador. Cada subdiviso de um
fator denominada de nvel do fator e os tratamentos nos experimentos
fatoriais consistem de todas as combinaes possveis entre os diversos
fatores nos seus diferentes nveis.
Por exemplo: num experimento fatorial podemos combinar 2 doses de
um antibitico com 3 diferentes nveis de vitamina B12. Neste caso teremos um
fatorial 2 x 3, com os fatores Antibiticos (A) e Vitamina (V), que ocorrem em
2 nveis (A1 e A2) e 3 nveis (V1, V2 e V3), respectivamente, e os 2 x 3 = 6
tratamentos so:
A1V1 A1V2 A1V3
A2V1 A2V2 A2V3
Outro exemplo: num experimento fatorial 3 x 2 podemos combinar 3
Doses de uma droga (D1, D2 e D3), 2 Idades (I1 e I2) e teremos 3x2 = 6
tratamentos, que resultam de todas as combinaes possveis dos nveis dos 3
fatores, ou seja,
D1I1 D1I2
D2I1 D2I2
D3I1 D3I2
Os experimentos fatoriais no constituem um delineamento experimental
e sim um esquema orientado de desdobramento de graus de liberdade de
tratamentos e podem ser instalados em qualquer um dos delineamentos
experimentais j estudados (DIC, DBC e DQL, por exemplo).
Em um experimento fatorial nos podemos estudar no somente os
efeitos dos fatores individuais, mas tambm, se o experimento foi bem
conduzido, a interao entre os fatores. Para ilustrar o conceito de interao
vamos considerar os seguintes exemplos:
Suponha que as mdias dos 3 x 2 = 6 tratamentos deste ltimo exemplo
so apresentadas na tabela abaixo:

Fator B - Idade
Fator A-(Dose da Droga) I0 I1
D0 5 10
D1 10 15
D2 15 25

Estatstica Experimental
127

Os seguintes aspectos importantes dos dados na Tabela acima devem


ser destacados:
Para ambos os nveis do fator B, a diferena entre as mdias para
quaisquer nveis do fator A a mesma;
Para todos os nveis do fator A, a diferena entre as mdias para
os dois nveis de B a mesma;
Uma terceira caracterstica notada por meio do grfico. Notamos
que as curvas correspondentes aos diferentes nveis de um fator
so todas paralelas.
Quando os dados da populao possuem estas trs caractersticas
listadas acima, dizemos que no existe interao presente entre os fatores. A
presena de interao entre os fatores pode afetar as caractersticas dos dados
de vrias formas dependendo da natureza da interao. Vamos ilustrar o efeito
de um tipo de interao modificando os dados da tabela apresentada
anteriormente
Fator B: Idade
Fator A: Dose da Droga I0 I1
D0 5 15
D1 10 10
D2 20 5
Os seguintes aspectos importantes dos dados na Tabela acima devem
ser destacados:
A diferena entre as mdias para qualquer dos dois nveis de A no
a mesma para ambos os nveis de B;
A diferena entre as mdias para ambos os nveis do fator B no
o mesmo nos nveis do fator A;
As curvas dos fatores no so paralelas, como mostrado nos
grficos abaixo;

Estatstica Experimental
128

Quando os dados da populao exibem as caractersticas acima,


dizemos que existe interao entre os dois fatores. Enfatizamos que o tipo de
interao ilustrada acima somente uma das dos muitos tipos de interao que
podem ocorrer entre dois fatores.
Em resumo, podemos afirmar que existe interao entre dois fatores se
uma modificao em um dos fatores produz uma modificao na resposta em
um dos nveis do outro fator diferente dos produzidos nos outros nveis deste
fator.
As vantagens de um experimento fatorial so:
A interao dos fatores pode ser estudada;
Existe uma economia de tempo e de esforo. Nos experimentos
fatoriais todas as observaes podem ser usadas para estudar o
efeito de cada um dos fatores investigados. A alternativa, quando
dois fatores so investigados, seria o de conduzir dois diferentes
experimentos, cada um para estudar cada um dos dois fatores. Se
isto feito, as observaes somente produziro informaes sobre
um dos fatores, e o outro experimento somente fornecer
informao sobre o outro fator. Para se obter o nvel de preciso
dos experimentos fatoriais, mais unidades experimentais seriam
necessrias se os fatores fossem estudados por meio de dois
experimentos. Isto mostra que 1 experimento com dois fatores
mais econmico que 2 experimentos com 1 fator cada um.
Visto que os vrios fatores so combinados em um experimento, os
resultados tm uma grande amplitude de aplicao.

2 Definies iniciais
Vamos considerar um experimento fatorial 2x2, com os fatores
Antibitico (A) e Vitamina B12 (B) nos nveis: a0 (sem antibitico) e a1 (com
antibitico); b0 (sem Vitamina B12) e b1 (com vitamina B12), respectivamente,
adicionados a uma dieta bsica e os seguintes valores mdios de ganho de
peso (g) para os 2x2 = 4 tratamentos:

Fator B: Vitamina B12


Fator A: Dose do antibitico b0 b1 Mdias
a0 14 23 18,5
a1 32 53 42,5
Mdias 23,0 38,0 30,5
A representao grfica fica:

Definies:

Estatstica Experimental
129

Efeito simples de um fator: como a medida da variao que


ocorre com a caracterstica em estudo (ganho de peso, neste
exemplo) correspondente s variaes nos nveis desse fator, em
cada um dos nveis do outro fator.
Efeito simples do antibitico no nvel 0 de vitamina B12 :
A(dentro de b0 ) a1b0 a 0b0 32 14 18
Efeito simples do antibitico no nvel 1 de vitamina B12:
A (dentro de b1 ) a1b1 a 0b1 53 23 30
Efeito simples da vitamina B12 no nvel 0 de antibitico :
B (dentro de a0 ) a 0b1 a 0b0 23 14 19
Efeito simples da vitamina B12 no nvel 1 de antibitico :
B(dentro de a1 ) a1b1 a 0b0 53 32 21

Efeito principal de um fator: uma medida da variao que


ocorre com a caracterstica em estudo, correspondente s
variaes nos nveis desse fator, em mdia, de todos os nveis do
outro fator.
A( dentro de b ) A( dentro de b ) 18 30
Efeito principal de A 0
1
24
2 2
B( dentro de a ) B( dentro de a ) 9 21
Efeito principal de B 0
15
1

2 2

Efeito da interao entre os dois fatores: uma medida da


variao mdia que ocorre com a caracterstica em estudo,
correspondente s variaes nos nveis de um fator, ao passar de
um nvel a outro do outro fator.
A(dentro de b ) A(dentro de b 30 18
)
Efeito da interao A x B 1 0
6, ou ainda,

2 2
B(dentro de a1 ) B(dentro de a 0 ) 21 9
Efeito da interao de B x A 6,
2 2
isto , tanto faz calcular a interao A x B como a interao B x A
As principais desvantagens dos experimentos fatoriais so:
O nmero de tratamentos aumenta muito com o aumento do
nmero de nveis e de fatores, tornando praticamente impossvel
distribu-los em blocos casualizados, devido exigncia de
homogeneidade das parcelas dentro de cada bloco.
A anlise estatstica mais trabalhosa (efeitos principais e
interao de todos os fatores) e a interpretao dos resultados se
torna mais difcil medida que aumentamos o nmero de nveis e
de fatores no experimento.

3 O modelo matemtico
O modelo de um experimento fatorial com dois fatores, num
delineamento inteiramente casualizado com r repeties, pode ser escrito
como:
y ijk i j ( )
ij ijk

Sendo:

Estatstica Experimental
130

yikj a k sima resposta que recebeu o i simo nvel do fator e o j simo



nvel do fator ;
uma cons tan te ( mdia) comum a todas as observaes;
i o efeito do i simo nvel do fator com i 1, . .., a;
j o efeito do j simo nvel do fator com j 1,..., b ;
ij o efeito da int erao do i simo nvel do fator com o efeito do
j simo nvel do fator ;
ijk o erro exp erimental associado observao y ijk com k 1, ..., r

4 Suposies do modelo
As suposies associadas ao modelo;
As observaes de cada clula ab constituem uma amostra
aleatria de tamanho r retirada de uma populao definida pela
particular combinao dos nveis dos dois fatores;
Cada uma das ab populaes normalmente distribuda;
Todas as populaes tm a mesma varincia;
ijk ~ N( o , 2 ) ;
e os parmetros i , j e( )
ij satisfazem as condies

a b a b

i j 0 e
i 1 j 1
( )
i 1
ij ( )
j 1
ij 0.

Vale observar que a o nmero de nveis do fator A, b o nmero de


nveis do fator B e r o nmero de repeties de cada um dos ab
tratamentos. No total temos abr unidades experimentais.

5 Hipteses estatsticas
As seguintes hipteses podem ser testadas nos experimentos fatoriais.
A hiptese de que no existe ou existe interao AB equivalente
s hipteses
H0 AB : ( )ij 0 vs H1AB : ( )ij 0 com i 1, ..., a e j 1, ..., b ;
De maneira anloga as hipteses de que no existe efeito principal
do fator A e B a mesma que as hipteses
H 0 A : i 0 vs H1 A : i 0 com i 1, ..., a
,
H 0 B : j 0 vs H1B : j 0 com j 1, ..., b
respectivamente.

6 Detalhes computacionais
Apresentaremos alguns passos que facilitam os clculos das somas de
quadrados da ANOVA.
O quadro abaixo mostra um possvel arranjo dos dados de um
experimento com os tratamentos em um arranjo fatorial 2 x 2

Estatstica Experimental
131

a1 a2
b1 b2 b1 b2
y111 y121 y 211 y 221
y112 y122 y 212 y 222
. . . .
. . . .
. .. .
y11r y12 r y 21r y 22 r

Pode-se montar o seguinte quadro auxiliar dos totais


(r) b1 b2 Totais
a1 Y11 Y12 Y1
a2 Y21 Y22 Y2
TOTAL Y1 Y2 Y

Assim os clculos do quadro da anlise de varincia so dados pelas


seguintes expresses:

Soma de Quadrados do Total (SQT)


r a b
(Y )2 (Y )2
SQT Yijk2 , sendo CM , sendo a 2 e b 2 ;
k 1 i 1 j 1 abr abr
1 a 2
Soma de Quadrados do fator A, SQ(A) SQ( A) Yi CM ;
br i 1
b
Soma de Quadrados do fator, B SQ(B) SQ(B ) 1 Y 2
j CM ;
ar j 1

Soma de Quadrados da interao AxB, SQ(AxB)=SQ(A,B)-SQ(A)-


a b
SQ(B) ou SQ( AxB ) 1 Y 2
ij CM , sendo a SQ(A,B) a soma de
r i 1 j 11

quadrado conjunta, que nos fatoriais com dois fatores igual


SQTr;
Soma de Quadrados do Resduo (SQR) SQR=SQT-SQ(A)-SQ(B)-
r a b r
SQ(AxB) ou SQR Yijk2 Yij2
k 1 i 1 j 1 k 1

7 Quadro da anova
Calculadas as SQ podemos montar o seguinte Quadro da ANOVA:

Fonte de Variao g.l. SQ QM F

Fator A a-1 SQ(A) QM(A)=SQ(A)/(a-1) QM(A)/QMR


Fator B b-1 SQ(B) QM(B)=SQ(B)/(b-1) QM(B)/QMR
Int A xB (a-1)(b-1) SQ(AxB) QM(A)=SQ(AxB)/(a-1)(b-1) QM(AxB)/QMR

Tratamentos ab-1 SQTr QMTr=SQTr/(ab-1) QMTr/QMR


Resduo ab(r-1) SQR QMR+SQR/ab(r-1)
TOTAL abr-1 SQT

8 Estatstica e regio crtica do teste

Estatstica Experimental
132

As estatsticas para os testes F da ANOVA so


QM ( A ) QM ( B ) QM ( AxB )
FcA , FcB e FcAB ,
QMR QMR QMR
a qual, deve ser prximo de 1 se H0 for verdadeira, enquanto que valores
grandes dessa estatstica so uma indicao de que H0 falsa. A teoria nos
assegura que FcA tem, sob H0 distribuio F Snedecor com (a -1) e ab(r-1))
graus de liberdade no numerador e no denominador, respectivamente.
Resumidamente, indicamos:
FcA ~ F( a1 , ab( r 1 ), ) , sob H0 .
Rejeitamos H0 para o nvel de significncia se
FcA F( a1 , ab( r 1 ), ) ,
sendo, F( a1 , ab( r 1 ), ) o quantil de ordem (1 ) da distribuio F-Snedecor
com (a -1) e ab(r-1) graus de liberdade no numerador e no denominador.
De modo anlogo temos FcB . Para a interao A x B a
FcAB ~ F( ( a1 )( b1 ) , ab( r 1 ), ) , sob H0
e rejeitamos H0 para o nvel de significncia se
FcAB F( ( a1 )( b1 ) , ab( r 1 ), ) , ,
sendo, F( ( a1 )( b1 ) , ab( r 1 ), ) o quantil de ordem (1 ) da distribuio F-
Snedecor com (a -1)(b-1) e ab(r-1) graus de liberdade no numerador e no
denominador respectivamente.

9 Exemplo 1 Considere o esquema fatorial 2 x 2 ( dois nveis de antibitico,


dois nveis de vitamina B12) para estudar o aumento de peso (Kg) dirio em
sunos.
a0 sem antibitico; a1 com 40 g de antibitico
b0 sem vitamina B12 ; b1 com 5 mg de vitamina B12
a0 a1
Repetio b0 b1 b0 b1
1 1,30 1,26 1,05 1,52
2 1,19 1,21 1,00 1,56
3 1,08 1,19 1,05 1,55
Totais 3,57 3,66 3,10 4,63

Formato do arquivo .txt Formato no Excel


anti vitb12 trat g.peso anti vitb12 trat g.peso
ao b0 t1 1.30
ao b0 t1 1.30
ao b0 t1 1.19
ao b0 t1 1.08 ao b0 t1 1.19
ao b1 t2 1.26 ao b0 t1 1.08
ao b1 t2 1.21 ao b1 t2 1.26
ao b1 t2 1.19 ao b1 t2 1.21
a1 b0 t3 1.05
a1 b0 t3 1.00 ao b1 t2 1.19
a1 b0 t3 1.05 a1 b0 t3 1.05
a1 b1 t4 1.52 a1 b0 t3 1.00
a1 b1 t4 1.56 a1 b0 t3 1.05
a1 b1 t4 1.55
a1 b1 t4 1.52
a1 b1 t4 1.56
a1 b1 t4 1.55
Notem que neste caso o delineamento experimental foi o inteiramente
casualizado com os tratamentos num esquema fatorial 2 x 2, com 3 repeties

Estatstica Experimental
133

Outra forma de apresentao dos dados


Trat. Repetio Totais
a0b0 1,30 1,19 1,08 3,57
a0b1 1,26 1,21 1,19 3,66
a1b0 1,05 1,00 1,05 3,10
a2b2 1,52 1,56 1,55 4,63
Calculo das Soma de Quadrados:
(1,30 ... 1,55 )2 (14,96 )2
SQT (1,30 2 ... 1,55 2 ) 0,4417;
(2 )(2 )(3 ) 12
3,57 2 3,612 3,10 2 4,63 2 (14,96 )2
SQTr 0,4124;
3 3 3 3 (2 )(2 )(3 )
SQR SQT SQTr 0,4418 0,4124 0,0293,
e ento, podemos construir um primeiro quadro de anlise de varincia:

Fonte de variao gl SQ QM F
Tratamentos 3 0,4124 0,1398 38,13
Resduo 8 0,0293 0,003667

TOTAL 11 0,4417

Como F( 3 ,8 ; 0.01 ) 7 ,59 podemos concluir que pelo menos duas mdias
de tratamentos diferem significativamente (p<0,01) entre si quanto ao ganho de
peso dirio de sunos. A continuao da anlise pode envolver a comparao
das mdias dos tratamentos por meio de um dos procedimentos de
comparaes mltiplas conhecidos, como os testes de Tukey, Duncan, t-
Student, Scheff etc.
Uma alternativa de anlise mais simples e mais informativa, est
baseada no esquema fatorial dos tratamentos. Utilizando o quadro com os
totais das combinaes dos nveis dos fatores A e B e as frmulas
apresentadas anteriormente, podemos construir um novo quadro de anlise de
varincia que permitir testar se existe interao entre os dois fatores e se
cada um dos fatores tem efeito significativo sobre o desenvolvimento dos
sunos.
Quadro auxiliar com os totais das combinaes dos nveis de
antibiticos (a0, a1)e vitamina B12
b0 b1 Totais
a0 3.57 3,66 7,23
a1 3,10 4,63 7,73
Totais 6,67 8,29 14,96
Assim,
7,232 7,732 14,962
SQ(A ) 0,0208;
2.(3 ) 2.(3 ) 4.(3 )
6,67 8,292 14,962
SQ(B ) 0,2187;
2(3 ) 2(3 ) 4(3 )
SQ(AxB ) 0,4124 0,0208 0,2187 0,1728.

Notem que SQTr = SQ(A) + SQ(B) + SQ(AxB) e que as somas de


quadrados associadas ao total e ao resduo permanecem inalteradas.
O novo quadro da ANOVA fica:

Estatstica Experimental
134

Fonte de variao gl SQ QM F
Antibtico (A) 1 0,0208 0,0208 5,68
Vitamina B12 (B) 1 0,2187 0,2187 59,65
Int. AxB 1 0,1728 0,1728 47,13
Tratamentos (3) 0,4124 0,137 37,33
Resduo 8 0,0293 0,00367
TOTAL 11 0,4417

Da tabela apropriada, temos F(3, 8; 0,01) = 7,59; F(1, 8, 0,05) = 5,32 ; F(1, 8 ;
0,01) = 11,26 Comparando os valores calculados das estatsticas F, podemos
concluir que:
o teste para a interao AxB foi significativo (p < 0,01), indicando
que o efeito da vitamina B12 na presena ou ausncia de antibitico
significativamente diferente.

Como a interao AxB resultou significativa (veja o grfico apresentado


acima), as interpretaes da significncia dos testes dos efeitos simples de
Antibitico (A) e de Vitamina B12 (B) perdem o significado. Precisamos estudar
a interao fazendo os seguintes desdobramentos:
a) Desdobramento da interao AxB para estudar o comportamento dos
fator A dentro de cada nvel de vitamina B12 (b0 e b1) :
1 2 Y 21
SQ(Adentro de b0 ) (Y11 Y 21 )
2

r 2(r )
2
1 2 2 (6,67 )
(3,57 3,10 ) 0,0368,
3 2(3 )
1 2 Y 22
SQ(Adentro de b1 ) (Y12 Y 22 )
2

r 2(r )
2
1 2 2 (8,29 )
(3,66 4,63 ) 0,1568
3 2(3 )

Assim, monta-se a seguinte anlise de varincia do desdobramento dos


graus de liberdade da interao A x B para se estudar o efeito do antibitico
no ganho de peso dirio de sunos na ausncia e na presena da vitamina B12.

Estatstica Experimental
135

F.V. G.L. S.Q. Q.M. F Pr.Fc


Adentro de b0 1 0,0368 0,0368 10,04 0.0132

Adentro de b1 1 0,1568 0,1568 42,76 2e-04


Residuo 8 0,0293 0,00367
A linha do resduo a mesma da ANOVA anterior.
Comparando os valores calculados da estatstica F com o valor tabelado
F( 1,8 ; 0 ,05 ) 5 ,32 e F( 1,8 ; 0 ,01 ) 11,3 , conclui-se que o efeito do fator antibitico no
peso dirio de sunos no nvel b0 de vitamina B12 significativo (p<0,05) e
significativo (p<0,01) no nvel b1 da vitamina B12. Ou ento, que:
Quando se utiliza a dose b0 de vitamina B12 existe uma diferena
no peso dirio dos sunos. A estimativa desta diferena dado por
A ( dentro de b0 ) a1b0 a0b0 1,03 1,19 0,16 Kg , e ela
significativa pelo teste F da ANOVA do desdobramento, indicando
que somente o efeito do antibitico prejudica o peso dirio dos
sunos, em mdia de 0,16 kg.
Quando se utiliza a dose b1 de vitamina B12 existe uma diferena
no peso dirio dos sunos. A estimativa desta diferena dada por
A ( dentro de b1 ) a1b1 a0b1 1,54 1,22 0,32 Kg
significativa pelo teste F da ANOVA do desdobramento, indicando
que a combinao dos nveis a1 do antibitico e b1 da vitamina B12,
favorece em mdia 0,32 kg o peso dirio dos sunos.

b) Desdobramento da interao AxB para estudar o comportamento dos


fator B dentro de cada nvel de antibitico A (a0 e a1) (como exerccio
preencher os espaos)
1 2 Y12
SQ( Bdentro de a0 ) ( Y11 Y12 )
2

r 2( r )
1 ( )2
( )
3
1 2 Y22
SQ( Bdentro de a1 ) ( Y21 Y22 )
2

r 2( r )
1 ( )2
( )
3
Assim, monta-se a seguinte anlise de varincia do desdobramento dos
graus de liberdade da interao A x B para se estudar o efeito da vitamina B12
no ganho de peso dirio de sunos na ausncia e na presena de antibitico:
F.V. G.L. S.Q. Q.M. F
Bdentro de a0 1 0,00135 0,00135 0,3682

Bdentro 1 0,39015 0,39015 106,4045


de a1
Residuo 8 0,0293 0,00367

(Concluir como no desdobramento anterior)


Podemos comparar as mdias de peso dirio de sunos dos antibiticos,
para cada uma dos nveis de vitamina B12, utilizando o Teste de Tukey (5%).
Para tanto, calculamos:

Estatstica Experimental
136

QMR QMR 0,00367


dms q( a , gl do resduo: 0 ,05 ) q( 2 , 8 ; 0 ,05 ) 3 ,26 0 ,1140
r 3 3
Quadro auxiliar com as mdias dos antibiticos para cada um dos nveis
da vitamina B12,
b0 b1
a0 1,19 A 1,22 A
a1 1,03 B 1,54 B
Obs.: mdias seguidas pelas mesmas letras maisculas, nas colunas, no diferem entre si a 5% de
probabilidade, pelo Teste de Tukey
(fazer como exerccio o teste de Tukey a 5%, para as linhas)
Notao geral dos totais de um esquema fatorial 2 x 2 organizados em
uma tabela 2x2, do tipo:
(r) b0 b1 Totais
a0 Y11 Y12 Y1
a1 Y21 Y22 Y2
TOTAL Y1 Y2 Y
As frmulas das Somas de Quadrados podem ser escritas de uma forma
geral:
Y2
SQT (Y111
2
... Y222
2
)
(a )(b )(r )
1 2 (Y )2
SQTr (Y11 Y12 Y21 Y22 )
2 2 2
;
r (a )(b )(r )
1 (Y )2
SQ( A) (Y1 Y2 )
2 2

2r (a )(b )(r )
1 (Y )2
SQ(B ) (Y1 Y 2 )
2 2
;
2r (a )(b )(r )
SQ( A x B ) SQTr SQ( A) SQ(B )
Script no r para obter os resultados acima
# entrada dos dados pelo comando read.table( )
dados.ex1 <- read.table("ex1fat.txt", header=T)

# imprimindo as 6 primeiras linhas do arquivo dados.ex1


head(dados.ex1)

# anexando o objeto dados.ex1 no caminho de procura


attach(dados.ex1)

# calculo das interaes - Quadros dos totais


int.total <- tapply(g.peso, list(anti, vitb12), sum)
int.total

# calculo dos totais marginais do fator vitamina B12


total.vitb12<- tapply(g.peso,vitb12,sum)
total.vitb12

# calculo dos totais marginais do fator antibitico


total.anti<- tapply(g.peso,anti,sum)

Estatstica Experimental
137

total.anti

# calculo das interaes - Quadros das mdias


int.media <- tapply(g.peso, list(anti, vitb12), mean)
int.media

# calculo das mdias marginais do fator vitamina B12


media.vitb12<- tapply(g.peso,vitb12,mean)# calculo das mdias do fator
vitamina b12ibitico
media.vitb12

# calculo das mdias marginais do fator antibitico


media.anti<- tapply(g.peso,anti,mean)# calculo das mdias do fator vitb12
media.anti

# anova sem o desdobramento do fatorial


gpeso.av <- aov(g.peso~trat)
summary(gpeso.av)

# quadro da anova no esquema fatorial


gpesofat.av <- aov(g.peso~anti+vitb12+anti*vitb12)
summary(gpesofat.av)

# grfico da interao
interaction.plot(vitb12, anti, g.peso,col=2,lwd=2,
ylab="mdias",xlab="Vitamina B12",
main="Grfico da Interao")

# requerendo o pacote ExpDes


require(ExpDes)
fat2.crd(anti, vitb12, g.peso, quali = c(TRUE, TRUE), mcomp = "tukey",
fac.names = c("Antibitico", "Vitamina B12"))

# dms do teste de tukey para antibitico dentro de cada nvel da vitamina


dms<- qtukey(0.95,2,8)*sqrt(anova(gpesofat.av)[4,3]/3)
dms

# retirando o objeto dados.ex1 do caminho de procura


detach(dados.ex1)

Estatstica Experimental
138

8 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL


1) Num experimento fatorial 22 ou 2 x 2, no delineamento inteiramente casualizado, com 6
repeties, foram estudadas as influncias de 2 fatores (A: Antibitico e B: Vitamina B12) sobre
o ganho de peso dirio em sunos.
Os tratamentos utilizados foram:
1- a0v0 - Testemunha = sem antibitico e sem vitamina B12
2- a1v0 - 40 g de antibitico
3- a0v1 - 5 mg de vitamina B12
4- a1v1 - 40 g de antibitico + 5 mg de vitamina B12.
Os resultados do ganho de peso dirios, em gramas, foram os seguintes:
Tratamentos 1 Rep. 2 Rep. 3 Rep. 4 Rep. 5 Rep. 6 Rep.
a0v0 590 540 491 532 545 544
a1v0 476 454 476 481 464 463
a0v1 572 549 540 558 563 562
a1v1 690 708 703 712 691 721
Usando o programa R, pede-se:
a) Escreva o modelo matemtico deste experimento.

Quadro dos Totais Quadro das Mdias


b0 b1 Totais b0 b1 Mdias
a0 a0
a1 a1
Totais Mdias
b) Formule as hipteses estatsticas para os fatores do fatorial e monte o quadro da anlise de
varincia com desdobramento dos graus de liberdade dos tratamentos de acordo com o
esquema fatorial 2 x 2 e preencha os espaos das frmulas abaixo:

2
2 2 6
y ijk
(Y )2 ... )2
CM i 1 j k 1
(

ab r ab r

r a b
( y )2
SQT y ijk
2

k 1 i 1 j 1 abr

SQ( A)
1
br
y i2 CM ( )2 (
)2

Estatstica Experimental
139

1
SQ(B )
ar
y 2
j CM
( 2
) ( 2
)

SQ(A x B )
SQTr SQ(A )
SQ(B ), sendo
1
SQTr (y 11
2
y 12 y 21 22 )
2 2 2
CM
r

( 2
) ... 2

SQR SQT SQA SQB SQ(AxB)

SQA SQB
QMA ;QMB
a 1 b 1
SQ( AxB )
;QM ( AxB )
(a 1)(b 1)

SQR
QMR
ab r ab
QMA
FA valor de p
QMR
QMB
FB valor de p
QMR

QM ( AxB )
FAB valor de p
QMR
Complete o quadro da anova abaixo:
F. V. gl SQ QM F p
Antibtico (A)
Vitamina B12 (B)
Int. AxB
Tratamentos
Resduo

TOTAL

Concluses:

Estatstica Experimental
140

c) Caso a interao seja significativa, fazer o desdobramento da interao, estimando testando


os efeitos simples dos efeitos dos antibiticos dentro de vitaminas e da vitamina dentro de
antibiticos (teste da anlise de varincia), ou seja, preencha as frmulas abaixo e o quadro da
anova

1 2 y 21
SQ( Adentro de b0 ) ( y 11 y 2
21 )
r b(r )

( )2 ( )2 (
( )
)2

1 2 y 22
SQ( Adentro de b1 ) ( y12 y 2
22 )
r 2( r )

( )2
( )
2
(
( )
)2

F.V. G.L. S.Q. Q.M. F p


Adentro de b0
Adentro de b1
Resduo
Concluses:

Escrever as frmulas para o desdobramento de Bdentro de ao e Bdentro de a1, monte o quadro da


anova abaixo
1 2 y 12
SQ(Bdentro de a0 )
(y 11 y 12 )
2

r a(r )
2
( )
( )

1 2 y 21
SQ(Bdentro de a 1 )
(y 21 y 22 )
2

r a(r )
2
( )
( )

Estatstica Experimental
141

F.V. G.L. S.Q. Q.M. F p


Bdentro de a0
Bdentro de a1
Residuo
Concluses:

d) Ainda com relao ao item c), d uma estimativa dos efeitos simples de antibiticos e de
vitaminas e conclua se eles so significativos. Aplique o teste de Tukey para localizar as
diferenas entre as mdias dos antibiticos dentro de vitaminas e das mdias das vitaminas
dentro de antibiticos Represente as diferenas com as mdias, seguidas de letras. Tire as
concluses prticas para este ensaio. Esboce o grfico da interao.

QMR
dms q( a, gl do resduo: 0,05 )
r
b0 b1 Mdias
a0
a1
Mdias
Concluses:

d) D uma estimativa dos efeitos simples de antibiticos e de vitaminas.

e) Teste a normalidade dos erros e a homogeneidade das varincias dos tratamentos.

Estatstica Experimental
142

g) Calcular os coeficientes de determinao (R2) e o de variao do experimento (CV).

(escrever um script no R para resolver esta questo)

2) Num experimento fatorial 2 x 4 , no delineamento em blocos casualizados, com 2 repeties


(2 Blocos), foram estudadas as influncias da primeira alimentao de colostro no nvel de
imunoglobulina em vacas leiteiras. O fator A foi a quantidade de comida (0,5 e 1,5 kg) e o fator
B foi o tempo da primeira alimentao (1, 2, 6, ou 12 horas depois do nascimento). Os valores
observados so unidades de turbidimetric relativas ao sulfato de brio padro de 20 quando o
sangue foi amostrado 48 horas aps o nascimento. O colostro foi misturado para eliminar a
variao entre as vacas.
Tempo da 1 alimentao
Bloco Quantidade
de comida 1 2 6 12
(kg)
I 0,5 7,9 10,2 6,1 2,3
1,5 11,7 10,7 9,9 5,4
II 0,5 9,5 6,0 7,8 7,1
1,5 15,0 11,7 9,4 7,2
Responder aos mesmos itens do exerccio 1) (Ateno este um fatorial 2 x 3)

3) Um experimento foi realizado para estudar a influncia no tempo de hemorragia do perodo,


fator A, e um composto estrognio, fator B , em plasma de sangue em ovelhas. Cinco ovelhas
foram sorteadas para cada um dos quatros tratamentos: a1b1 de manh e sem estrognio;
a1b2 de manh com estrognio; a2b1 de tarde e sem estrognio; a2b2 de tarde com
estrognio

Tratamentos Rep. 1 Rep. 2 Rep. 3 Rep. 4 Rep. 5


a0 b0 8,53 20,53 12,53 14,00 10,80
a0 b1 17,53 21,07 20,80 17,33 20,07
a1 b0 39,14 26,20 31,33 45,80 40,20
a1 b1 32,00 23,80 28,87 25,06 29,33
Responder aos mesmos itens do ecerccio 1)

4) Um experimento para verificar o peso aos 180 dias de sunos com as raas Landrace e
Large White, utilizou-se de 480 sunos, machos e fmeas, sendo estes distribudos em trs
sunoculturas. a) Quais os fatores que podem influenciar a resposta medida. b) Estabelea um
modelo matemtico para o experimento. c) Faa um esquema da anlise de varincia (F.V. e
g.l.) para o experimento.

5) Em um experimento realizado na Fazenda Experimental Iguatemi da Fundao Universidade


Estadual de Maring, para verificar o efeito de diferentes tipos de instalaes durante o inverno
e vero sobre o ganho de peso e converso alimentar de coelhos da raa Nova Zelndia, aos
40 e 70 dias de idade, foram utilizados 3 tipos de instalaes, gaiolas ao ar livre, gaiolas de
arame galvanizado em galpo aberto e gaiolas de arame galvanizado em galpo fechado.
Utilizou-se 178 animais machos e fmeas para a obteno dos dados. a) Quais os fatores que
podem influenciar a resposta medida. b) Estabelea um modelo matemtico para o
experimento. c) Faa um esquema de anlise de varincia para o experimento.

Estatstica Experimental
143

Aula 9 Experimentos fatoriais: analisando um fatorial A x B


O mtodo de anlise de um experimento fatorial 2 x 2 pode, de uma
maneira geral, ser estendido a qualquer experimento fatorial A x B. A
estratgia para analisar um experimento fatorial a x b a mesma utilizada
para os experimentos fatoriais 2 x 2.
teste a interao entre os dois fatores.
se a interao significativa, ento analisamos os efeitos simples
dos dois fatores.
se a interao no significativa, ento analisamos os efeitos
principais de cada fator

Exemplo 1 Casualizao dos tratamentos de um esquema fatorial 2 x 3 em


DBC com 4 repeties:

Tratamentos
b1 a1b1
a1 b2 a1b2 Bloco I Bloco II Bloco III Bloco IV
a2b1 a2b3 a1b2 a1b1
b3 a1b3 a1b2 a2b2 a2b1 a1b3
a2b2 a1b1 a2b2 a2b1
a2b3 a2b1 a1b3 a2b2
b1 a2b1 a1b1 a1b2 a2b3 a1b2
a1b3 a1b3 a1b1 a2b3
a2 b2 a2b2
b3 a2b3

Com o seguinte esquema da ANOVA


Fonte de Variao gl
Fator A a-1
Fator B b-1
Int. A x B (a 1)(b 1)
Tratamentos ab - 1
Blocos r -1
Resduo (ab -1)(r 1)
Total abr - 1

De uma maneira geral as somas de quadrados so dadas por:


Y 2
SQT (Y111
2
... Y abk
2
)

abr
Y11 Y12
2 2
Y ab2 Y 2
SQTr ... ;
r r r abr
Y2 Y2 Y2 Y2
SQ(A ) 1 2 ... i ;
br br br abr
Y2 Y2 Y j Y 2 .
2

SQ(B ) 1 2 ... ;
ar ar ar abr
SQ(AxB ) SQ(A, B ) SQ(A ) SQ(B ), ou SQ(AxB )
SQTr SQ(A )
SQ(B )

Estatstica Experimental
144

Como dissemos na aula passada: nos fatoriais A x B a Soma de


Quadrados Conjunta SQ(A,B) igual Soma de Quadrados dos Tratamentos
SQTr.
Quadro da ANOVA no DIC
F.V. G.L. S.Q. Q.M. F
A a-1 S.Q.(A) Q.M.(A) FA
B b-1 S.Q.(B) Q.M.(B) FB
Interao A x B (a-1)(b-1) S.Q.(AB) Q.M.(AB) FAB
Tratamentos ab-1 S.Q. Trat. Q.M. Trat. FTr
Resduo ab (r-1) S.Q. Res. Q.M. Res.
Total abr-1 S.Q. Total
Exemplo 1. Fatorial 2 x 3 (com interao no significativa):
O crescimento do contedo de gua em tecidos de lesmas sob 6
diferentes condies experimentais foi avaliada. As 6 condies foram obtidas
combinado-se os dois nveis de temperatura (fator A) com trs nveis de
umidade (fator B) com. Foram feitas 4 repeties para cada combinao de
tratamento. Os resultados, em porcentagem, foram :
Fator A Fator B Umidade (%)
(Temperatura C) 45 75 100
76 64 72 82 100 96
20 79 71 86 86 92 100
72 72 72 75 100 94
30 64 70 82 84 98 99
Formato no Excel (.xls) Formato no Bloco de notas (.txt)
Temp umi trat ca temp umi trat ca
20 45 t1 76 20 45 t1 76
20 45 t1 64 20 45 t1 64
20 45 t1 79 20 45 t1 79
20 45 t1 71
20 45 t1 71
20 75 t2 72
20 75 t2 72 20 75 t2 82
20 75 t2 82 20 75 t2 86
20 75 t2 86 20 75 t2 86
20 75 t2 86 20 100 t3 100
20 100 t3 100 20 100 t3 96
20 100 t3 96 20 100 t3 92
20 100 t3 92 20 100 t3 100
20 100 t3 100 30 45 t4 72
30 45 t4 72
30 45 t4 72
30 45 t4 64
30 45 t4 72 30 45 t4 70
30 45 t4 64 30 75 t5 72
30 45 t4 70 30 75 t5 75
30 75 t5 72 30 75 t5 82
30 75 t5 75 30 75 t5 84
30 75 t5 82 30 100 t6 100
30 75 t5 84 30 100 t6 94
30 100 t6 100 30 100 t6 98
30 100 t6 99
30 100 t6 94
30 100 t6 98
30 100 t6 99

Os totais das 4 repeties para o fatorial A x B = (2)(3)= 6 tratamentos


so os seguintes:

Estatstica Experimental
145

(4)
Nveis de A Nveis de B (Umidade (%))
(Temperatura C)) b1 = 45 % b2 = 75 % b3 = 100 % Total
a1 = 20 C 290 326 388 1004
a2 = 30 C 278 313 391 982
Total 568 639 779 1986

Clculos das soma de quadrados:


19862
SQT (762 ... 992 )
3386,5
(2 )(3 )(4 )
2902 3262 4912 19862
SQTr ... 2922,0;
4 4 4 (2 )(3 )(4 )
10042 9822 19862
SQ(A ) 20,17;
(3 )(4 )(3 )(4 )(2 )(3 )(4 )
5682 7792 19862
SQ(B ) ... 2881,75;
(2 )(4 ) (2 )(4 )(2 )(3 )(4 )
SQ(A * B ) SQTr SQ(A ) SQ(B )

2922,0 20,17 2881,75 20,08
Quadro da anova
F.V. G.L. S.Q. Q.M. F Pr>(Fc)
Temperatura (A) 1 20,17 20,17 0,78ns 0.388
Umidade (B) 2 2881,75 1440,88 55,85** 1.91e-08
Interao A x B 2 20,08 10,04 0,39ns 0.683
Tratamentos (5) 2922,0 584,40 22,65* 3.48e-07
Resduo 18 464,5 25,81
Total 23 3386,5
F(1, 18; 0,05) = 4,41 ; F(1, 18, 0,01)= 8,29; F(2, 18; 0,05)= 3,55; F(2, 18, 0,01)= 6,01
F(5, 18; 0,05) = 2,77; F(5, 18, 0,01)= 4,25
Do quadro acima, observamos que o teste da interao entre a
temperatura e umidade no significativa (p>0,05), e conclumos que os dados
no suportam a hiptese de uma interao entre temperatura e umidade. Dado
que a interao no foi significativa, a anlise prossegue analisando-se os
efeitos principais da temperatura e da umidade isoladamente. Isto pode ser
feito analisando-se os dois tipos de diferenas:
as diferenas entre os contedos mdios da gua nos tecidos nos
dois nveis de A (temperatura).
as diferenas entre os contedos mdios da gua nos tecidos nos
trs nveis de B (umidade).
O teste F para o efeito principal A no significativo (p>0,05), e portanto
no existe evidncias suficientes para concluir que os valores mdios do
contedo da gua nos tecidos so diferentes nos dois nveis de temperatura,
entretanto, o teste F para o efeito principal da umidade altamente significativo
(p<0,01), o que implica que os dados suportam a concluso de que os valores
mdios do contedo da gua nos tecidos no so os mesmos nos trs nveis
da umidade.
Isto pode ser visualizado na tabela de mdias abaixo (ltima linha):

Estatstica Experimental
146

Quadro de mdias dos tratamentos


(4) Nveis de B ( Umidade (%) )
(Temperatura C)) b1 = 45 % b2 = 75 % b3 = 100 % Mdias
a1 = 20 C 72,50 81,50 97,00 83,67 A
a2 = 30 C 69,50 78,25 97,75 81,83 A

Mdias 71,00 c 79,88 b 97,38 a 82,75


Mdias com a mesma letra maiscula nas colunas no diferem entre si pelo teste de Tukey a 5%
Mdias com a mesma letra minscula nas linhas no diferem entre si pelo teste de Tukey a 5%
Fazendo o grfico da interao (nveis de b no eixo x e nveis de a em y)

Clculos do teste de Tukey:


para o efeito principal A (temperatura):

q ( 2 ,18 ; 0 ,05 ) 2 ,97


25 ,81
4 ,36dmsA 2 ,97
12
para o efeito principal de B (Umidade):

q( 3,18;0,05 ) 3,609
25,81
dmsB 3,6 o9 6,48
8
Gr
fi
cod
asm
d
a
isd
ostra
tame
nto
s
In
tera
oAxB
1
02

9
6

2
0 C
3
0
9
0
Md
ia

8
4
Mdiaobservadadocontedodagua(%)

7
8

7
2

6
6
4
5 7
5 1
00

U
mid
ad
e(%
)

O grfico das mdias dos tratamentos fornece um conveniente mtodo


de mostrar os resultados. As linhas slidas no grfico da interao so

Estatstica Experimental
147

praticamente paralelas, isto confirma o resultado do teste F para a interao


entre temperatura e umidade. Mais ainda, a proximidade das duas linhas
slidas indica que as diferenas entre as respostas mdias observadas nas
duas temperaturas so no significativas; esta concluso confirmada pelo
teste F do efeito principal da temperatura. Uma checagem grfica para
presena do efeito principal da umidade dada pela orientao da linha
pontilhada. Se o efeito principal de tal efeito no estivesse presente, ento a
linha pontilhada deveria estar paralela ao eixo x. O grfico mostra que no
este o caso. O teste F para o efeito principal de B (umidade) suporta esta
concluso.
Outra forma de explicar a significncia do fator B por meio da
regresso polinomial, ou seja, as diferenas entre as mdias do fator umidade
so explicadas por equao do segundo grau
Gr
fi
cod
asm
d
a
isd
ofa
torB
E
qu
a
oau
jsta
da
y
=82
.47
1-0
.58
5*x+
0.0
07*x^
2+e
ps
1
00

9
6

9
2

8
8

8
4
Mdiasdoscontedodagua(%)

8
0

7
6

7
2

6
8
4
0 4
5 5
0 5
5 6
0 6
5 7
0 7
5 8
0 8
5 9
0 9
5 1
00 1
05

U
mid
ad
e(%
)

Script no R para obter os resultados do exemplo 1


# entrada dos dados pelo comando read.table( )
dados.ex1_9 <- read.table("ex1fat_9.txt", header=T)

# imprimindo as 6 primeiras linhas do arquivo dados.ex1_9


head(dados.ex1_9)

# anexando o objeto dados.ex1_9 no caminho de procura


attach(dados.ex1_9)

# calculo das interaes - Quadros dos totais


int.total <- tapply(ca, list(temp, umi), sum)
int.total

# calculo dos totais marginais do fator temperatura


total.temp<- tapply(ca,temp,sum)
total.temp

# calculo dos totais marginais do fator umidade


total.umi<- tapply(ca,umi,sum)
total.umi

# calculo das interaes - Quadros das mdias


int.media <- tapply(ca, list(temp, umi), mean)

Estatstica Experimental
148

int.media

# calculo das mdias marginais do fator temp


media.temp<- tapply(ca,temp,mean)
media.temp

# calculo das mdias marginais do fator antibitico


media.umi<- tapply(ca,umi,mean)
media.umi

# anova sem o desdobramento do fatorial


ca.av <- aov(ca~trat)
summary(ca.av)

# quadro da anova no esquema fatorial


cafat.av <- aov(ca~factor(temp)+factor(umi)+factor(temp)*factor(umi))
summary(cafat.av)

# grfico da interao
interaction.plot(umi, temp, ca,col=2,lwd=2,
ylab="mdias de ca",xlab="nveis da umidade",
main="Grfico da Interao")

# requerendo o pacote ExpDes


require(ExpDes)
fat2.crd(factor(temp), factor(umi), ca, quali = c(TRUE, TRUE), mcomp =
"tukey",
fac.names = c("Temperatura", "Umidade"))

# dms do teste de tukey para fator temperatura


dmsa<- qtukey(0.95,2,18)*sqrt(anova(cafat.av)[4,3]/12)
dmsa

# dms do teste de tukey para fator umidade


dmsb<- qtukey(0.95,3,18)*sqrt(anova(cafat.av)[4,3]/8)
dmsb

# Regresso Linear
# Definio de x e y
x <- c(45,75,100)
ca.media <- tapply(ca,umi,mean) #c(71.0, 79.88, 97.38)
ca.media

#ajuste da equao linear


reg.lin <- lm(ca.media~um )
reg.lin
plot(um,ca.media,pch=16,xlab="umidade")
abline(reg.lin,col=2,lwd=2)

# anlise de varincia para testar se o coef angular significativo


anova(reg.lin)

Estatstica Experimental
149

# ajuste de uma equao quadrtica


reg.quad <- lm(ca.media ~ um + I(um^2))
reg.quad

# desenhando a curva ajustada e adicionado ao grfico


curve(82.488636 -0.585985*x+0.007348*x*x, 40,100, lwd=2,col=4,add=T)

# retirando o objeto dados.ex1_9 do caminho de procura


detach(dados.ex1_9)

Exemplo 2: Anlise e interpretao de um experimento fatorial com trs fatores


Esquema fatorial 2 x 2 x 2 = 23 em um delineamento em blocos
casualizados (DBC)para estudar a produo de leite de vacas holandezas
arranjadas em 6 lotes com a mesma idade.
Trat. sendo :
c1 a1b1c1
b1
a c2 a1b1c2 a1: 0,5 kg de rao tipo A
1
c1 a1b2 c1 a2 : 0,5 kg de rao tipo B
b2
c2 a1b2 c2 b1: 0,5 kg de rolo de milho

b c1 a2 b2 c1 b2 : 1,0 kg de rolo de milho
1
c2 a2 b1c2 c1: 0 mg de vitamina B12
a2
b c1 a2 b2 c1 c2 : 5 mg de vitamina B12
2 c2 a2 b2 c2

6 Blocos ( 6 classesde idade)
Dados
Nveis dos BLOCOS
fatores
A B C I II III IV V VI Total
1 1 1 3,029 3,857 2,448 2,448 3,543 4,314 19,639
1 1 2 2,438 3,086 3,771 4,657 1,962 3,210 19,124
1 2 1 3,448 3,600 3,895 4,267 3,086 3,657 21,953
1 2 2 3,533 5,048 3,467 4,095 1,876 2,895 20,914
2 1 1 3,362 3,714 3,429 3,190 2,686 4,038 20,419
2 1 2 4,905 6,295 4,924 4,952 5,381 5,543 32,000
2 2 1 4,171 3,114 4,124 3,981 3,038 3,590 22,018
2 2 2 4,476 4,752 4,848 4,676 6,829 3,771 29,352
Total 29,362 33,466 30,906 32,266 28,401 31,018 185,419
Para calcular as somas de quadrados dos efeitos A, B e C, inicialmente
devemos organizar quadros auxiliares, que relacionam os nveis dos fatores 2
a 2, o que d 3 quadros A com B, A com C e B com C.
Exemplo: Quadro I (A x B) totais de :

a1b1 = a1b1c1 + a1b1c2 = 19,639 + 19,124 = 38,763


a1b2 = a1b2c1 + a1b2c2 = 21,953 + 20,914 = 42,867
a2b1 = a2b1c1 + a2b1c2 = 20,419 + 32,000 = 52,419
a2b2 = a2b2c1 + a2b2c2 = 22,018 + 29,352 = 51,370

Quadro I (totais da interao A x B)

Estatstica Experimental
150

(12)
Nveis de A Nveis de B (Rolo de milho kg)
(Qtde de rao) b1 = 0,5 kg b2 = 1,0 kg Total
a1 = 0,5 kg de A 38,763 42,867 81,630
a2 = 0,5 kg de B 52,419 51,370 103,789
Total 91,182 94,237 185,419

Quadro II (totais da interao A x C)


(12)
Nveis de A Nveis de C (Dose de vit. B12 mg)
(Qtde de rao) c1 = 0,0 mg c2 = 5,0 mg Total
a1 = 0,5 kg de A 41,592 40,038 81,630
a2 = 0,5 kg de B 42,437 61,352 103,789
Total 84,029 101,390 185,419

Quadro III (totais da interao B x C)


(12) Nveis de C (Dose de vit. B12 mg)
Nveis de B c1 = 0,0 mg c2 = 5,0 mg Total
b1 = 0,5 kg 40,058 51,124 91,182
b2 = 1,0 kg 43,971 50,266 94,237
Total 84,029 101,390 185,419

Somas de quadrados da ANOVA preliminar:


185,4192
SQT (3,0292 ... 4,314 2 ) 49,845;
(2 )(2 )(2 )(6 )
19,4592 29,352 2 185,4192
SQTr ... 26,748;
6 6 (2 )(2 )(2 )(6 )
1 185,4192
SQBl (29,362 ... 31,018 )
2 2

8 (2 )(2 )(2 )(6 )
2,134;
SQR SQT SQTr SQBl 20,963
81,630 2 103,7892 1854192
SQ( A) 10,230;
(2 )(12 ) (2 )(12 ) (2 )(2 )(2 )(6 )
91,182 2 94,237 2 185,4192
SQ(B ) 0,194;
(2 )(12 ) (2 )(12 ) (2 )(2 )(2 )(6 )
84,0292 101,390 2 185,4192
SQ(C ) 6,279;
(2 )(12 ) (2 )(12 ) (2 )(2 )(2 )(6 )
Para o clculo das soma de quadrados das interaes precisamos
calcular as somas de quadrados conjuntas. Para a interao AxB, temos:
1 185,4192
SQ( A, B ) (38,7632 ... 51,3702 ) 10,992
12 (2 )(2 )(2 )(6 )
S.Q( AxB ) SQ( A, B ) SQ( A) SQ(B ) 10,192 10,230 0,194 0,568

Para a interao AxC, temos:

Estatstica Experimental
151

1 185,4192
SQ(A,C ) 2
(41,592 ... 61,352 )2
25,358
12 (2 )(2 )(2 )(6 )
SQ(AxC ) 25,238 10,230 6,279 8,729

Para a interao BxC, temos:


1 185,4192
SQ(B,C ) (40,0582 ... 50,2662 ) 6,948
12 (2 )(2 )(2 )(6 )
SQ(BxC ) 6,948 0,194 6,279 0,475

SQ( AxBxC ) SQTr SQ( A ) SQ( B ) SQ( C )


SQ( AxB ) SQ( AxC ) SQ( BxC ) 0 ,289
Fonte de variao Gl S.Q. Q.M. F
Rao (A) 1 10,230 10,230 17,078**
Rolo (B) 1 0,194 0,194 0,324ns
Vitamina B12 (C) 1 6,279 6,279 10,482**
Int.( AxB) 1 0,568 0,568 0,948ns
Int. (AxC) 1 8,729 8,729 14,573**
Int. ( BxC) 1 0,475 0,475 0,793ns
Int. (AxBxC) 1 0,289 0,289 0,482ns
Tratamentos (7) 26,748 3,821 6,380**
Blocos 5 2,134 0,427 0,713ns
Resduo 35 20,963 0,599
Total 47 48,845
F(5, 35; 0,05) = 2,49 F(3, 35; 0,01) = 3,61 F(1, 35; 0,05) = 4,13 F(1, 35; 0,01) = 7,44

Concluses:
a interao AxBxC no significativa (p>0,05), indicando a
possibilidade de independncia entre os fatores conjuntamente.
os testes F das interaes duplas indicam que somente a interao
AxC significativa (p<0,01), ou seja, os dados suportam uma
concluso de que os tipos de raes interagem com a dose de
vitamina B12 na produo de leite.

Desdobramento da interao AxC: estudo dos efeitos simples do fator


rao (A) nos nveis das doses de vitamina B12 (C)
Clculo da SQ do efeito da rao na ausncia da vitamina B12
1 84 ,029 2
SQ( Adentro C1 ) ( 41,592 2 42 ,437 2 ) 0 ,030
12 24
Clculo da SQ do efeito da rao na presena da vitamina B12
1 101,390 2
SQ( Adentro de C2 ) ( 40 ,038 2 61,352 2 ) 18 ,929
12 24
Quadro da ANOVA do desdobramento:

Fonte de variao gl. SQ QM F


Adentro de C1 1 0,030 0,030 0,0497*

Adentro deC2 1 18,929 18,929 31,601**


Resduo 35 20,963 0,599

Estatstica Experimental
152

Concluso: as raes produzem efeito significativo (p<0,05) na ausncia


da vitamina B12, enquanto que na presena da vitamina B12 as raes tm
efeito significativo (p<0,01) diferenciado.
Desdobramento da interao AxC: estudo dos efeitos simples do fator
vitamina (C) nos nveis das Raes (A)
Clculo da SQ do efeito da vitamina no nvel a1 da rao
1 84,0292
SQ(Cdentro a 1 ) 2 2
(41,592 40,038 ) 0,1026
12 24
Clculo da SQ do efeito da vitamina no nvel a2 da rao
1 103,7892
SQ(Cdentro de a 2 ) 2 2
(42,437 61,352 ) 14,9074
12 24
Quadro da ANOVA do desdobramento:
Fonte de variao gl. SQ QM F
Cdentro de a1 1 0,1006 0,1006 0,168NS

Cdentro dea2 1 14,9074 14,9074 24,88**


Resduo 35 20,963 0,599
Concluso: as vitaminas no produzem efeito significativo (p>0,05) na
rao tipo A, enquanto que na rao tipo B a vitamina B12 tem efeito
significativo (p<0,01) diferenciado.

Exemplo 4 Anlise de um fatorial 3 x 4 : experimento sobre a qualidade do


ovo, em unidades Haugh, segundo 3 embalagens e 4 tempos de
armazenamento de estocagem.
Embalagem Tempo Blocos
Ai Bj I II III IV
1 1 66 52 57 68
1 2 47 47 32 43
1 3 43 50 39 40
1 4 20 23 43 41
2 1 81 68 60 55
2 2 62 34 44 45
2 3 43 41 47 54
2 4 51 32 29 34
3 1 81 82 80 78
3 2 84 68 66 65
3 3 58 43 37 57
3 4 75 45 59 48

Quadro da anova
F.V. G.L. S.Q. Q.M. F
Embalagem (A) 2 3427,125 1713,562 24,586**
Tempo (B) 3 5186,229 1728,748 24,803**
Interao A x B 6 768,708 128,118 1,838ns
Tratamentos (11) 9382,06 852,91 12,24**
Blocos 3 829,729 276,576 3,968*
Resduo 33 2300,021 69,697
Total 47 12511,812

Concluses:
o efeito da interao A x B no significativo (p>0,05), ou seja,
existe uma independncia entre os fatores.
efeito do fator embalagem (A) significativo (p<0,05).

Estatstica Experimental
153

efeito do fator tempo (B) significativo (p<0,05).


Teste de Tukey para o fator A
q( 3, 33, 0,05 ) 3,49
69,697
dmsA 3,49 7,28
16
Teste de Tukey para o fator B
q( 4, 33, 0,05 ) 3,85
69,697
dmsB 3,85 9,28
12
Quadro dos valores mdios observados

(4) B1 B2 B3 B4 Yi
A1 60,75 42,25 43,00 31,75 44,44 B
A2 66,00 46,25 46,25 36,50 48,75 B
A3 80,25 70,75 48,75 56,75 64,12 A
Y j 69,00 a 53,08 b 46,00 bc 41,67 c 52,44
Mdias com a mesma letra minscula nas linhas no diferem entre si pelo teste de Tukey a 5%
Mdias com a mesma letra maiscula nas colunas no diferem entre si pelo teste de Tukey a 5%

Exemplo 5 Em um experimento de substituio do farelo de soja pelo farelo de


girassol na rao de sunos, montou-se um experimento fatorial 2x5, com os
fatores Sexo (machos e fmeas) e Rao com substituio de farelo de soja
por farelo de girassol (0%, 25%, 50%, 75% e 100%), utilizando-se 30 sunos
(15 machos e 15 fmeas) castrados da raa Duroc-Jersey, num delineamento
em blocos casualizados com 3 repeties, de acordo com os grupos de pesos
iniciais. Os resultados de ganho de peso dos animais aos 112 dias de
experimento esto apresentados na tabela a seguir:
Machos Fmeas
Bloco G0 G25 G50 G75 G100 G0 G25 G50 G75 G100
1 85,0 94,5 99,5 93,0 83,0 77,9 71,5 67,5 71,5 89,5
2 86,0 96,0 98,0 96,0 80,0 83,2 73,5 63,5 70,8 91,8
3 84,0 95,8 104,0 90,5 78,5 83,5 70,5 65,0 72,5 92,9
Total 255,0 286,3 301,5 279,5 241,5 244,6 215,5 196,0 214,8 274,2
Pede-se:
Montar o esquema da Anlise de Varincia e fazer os testes
convenientes;
Comparar as mdias dos nveis do fator G dentro de cada um dos
nveis do fator S;
Construir grficos para estudar o comportamento das respostas
mdias dos nveis de G para cada um dos nveis de S.

Estatstica Experimental
154

Quadros auxiliares
Rao
Sexo G0 G25 G50 G75 G100 Total

1 255,0 286,3 301,5 279,5 241,5 1363,8


2 244,6 215,5 196,0 214,8 274,2 1145,1
Total 499,6 501,8 497,5 494,3 515,7 2508,9

Bloco B1 B2 B3 Total
Total 832,9 838,8 837,2 2508,9

(Resolver os exemplos 4) e 5) no R)

Estatstica Experimental
155

9 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL


1) Num experimento fatorial 32 = 3 x 3, com os fatores A e B, no delineamento em blocos ao
acaso, com 4 repeties, para se estudar uma determinada caracterstica, foram obtidos os
seguintes resultados
Tratamentos 1 Bloco 2 Bloco 3 Bloco 4 Bloco
a0b0 25,3 24,2 24,3 33.0
a0 b1 31,6 29,7 30,6 32,2
a0 b2 19,7 18,2 16,0 17,0
a1 b0 24,7 34,7 28,9 27,6
a1 b1 28,4 44,4 41,1 38,4
a1 b2 30,8 42,4 33,6 35,1
a2 b0 37,2 47,6 38,6 40,6
a2 b1 42,6 45,8 38,4 43,4
a2 b2 56,0 58,8 57,0 55,0
Os resultados da anlise de varincia preliminar foram:
FV G.L. S. Q. Q. M. F P
Blocos 3 150,3 50,1 4,2 0,016
41,8 0,000
Tratamentos 8 3967,3 495,9
Resduo 24 284,3 11,8
Total 35 4401,9

a) Checar os resultados do quadro da ANOVA acima e concluir, em seguida fazer a anlise de


varincia com o desdobramento dos graus de liberdade de tratamentos, segundo o
esquema fatorial e concluir.
b) No desdobramento da interao fazer a anlise de varincia do desdobramento e aplicar o
teste de Tukey (5%) valores mdios do fator A nos nveis do fator B e vice versa.
c) Calcular os coeficientes de determinao e de variao do experimento.

2) Um experimento fatorial 2 x 5, com os fatores Sexo (A) e Rao (B) , em um delineamento


em blocos ao acaso, com 3 repeties, foi realizado para se estudar a Substituio do farelo
de soja pelo farelo de girassol em rao de sunos (Kronka,1969)- BIA, n.26 pg 147-154. Os
dados abaixo referem-se ao ganho de peso (kg) em 112 dias de experimento.
Descrio dos fatores : Sexo a1 : Machos; a2 : Fmeas
Raes:
b1 : Rao Bsica (RB) + farelo de soja (100%);
b2 : RB + farelo de soja (75%) + farelo de girassol (25%);
b3 : RB + farelo de soja (50%) + farelo de girassol (50%);
b4 : RB + farelo de soja (25%) + farelo de girassol (75%);
b5 : RB + farelo de girassol (100%);
Tratamentos 1 Bloco 2 Bloco 3 Bloco
a1 b1 95,0 86,0 94,0
a1 b2 91.5 99,0 94,0
a1 b3 94,5 93,0 94,0
a1 b4 89,0 86,0 90,5
a1 b5 93,0 80,0 78,0
a2 b1 87,0 79,0 84,0
a2 b2 91,0 93,5 103,5
a2 b3 77,5 68,5 70,0
a2 b4 82,5 80,5 82,5
a2 b5 64,5 65,5 60,5

Resultados da anava preliminar


F.V. G.L. S.Q. Q.M. F
Blocos 2 60,02 30,01 1,56ns
Trat. 9 2994,54 332,73 17,34**
Res. 18 345,48 19,19
Total 29 3400,04

Estatstica Experimental
156

a) Checar os resultados do quadro da ANOVA acima e concluir, em seguida fazer a anlise de


varincia com o desdobramento dos graus de liberdade de tratamentos, segundo o esquema
fatorial e concluir.
b) Fazer a anlise de varincia com o desdobramento dos graus de liberdade de tratamentos,
segundo o esquema fatorial e teste a significncia da interao entre os efeitos. Se a interao
for significativa teste a diferena mdia dos ganhos de peso do efeito de sexo para cada rao
e as diferenas entre os valores mdios das raes para cada sexo.
c) Calcular os coeficientes de determinao e de variao do experimento.

Estatstica Experimental
157

Aula 10 Experimentos em parcela subdividida


1 Introduo
Nos experimentos fatoriais ou esquemas fatoriais os tratamentos
gerados pelas combinaes dos nveis dos fatores so designados s unidades
experimentais de acordo com o procedimento de aleatorizao do
delineamento inteiramente casualizado (DIC), ou do delineamento em blocos
casualizados (DBC), ou do delineamento em quadrado latino (DQL).
Entretanto, outros tipos de aleatorizao so possveis. Uma dessas
aleatorizaes alternativas d origem aos experimentos em parcelas
subdivididas, os quais so um caso especial de blocos incompletos. O
princpio bsico deste delineamento que parcelas principais que recebem
nveis de um fator so subdivididas em subparcelas ou subunidades, as quais
recebem os nveis de um outro fator. Assim cada parcela funciona como um
bloco para as subparcelas. Os nveis do fator sorteado nas parcelas so
denominados de tratamentos principais e os nveis do fator sorteados nas
subparcelas so denominados de tratamentos secundrios. O delineamento
em parcela subdividida teve sua origem na experimentao agronmica, com
as parcelas, quase sempre, sendo grandes reas de solo e as subparcelas
sendo reas menores de solo dentro das grandes reas. Os tratamentos
principais so distribudos s parcelas de acordo com um delineamento
especificado (DIC, DBC, DQL etc.) e os tratamentos secundrios so
distribudos aleatoriamente s subparcelas dentro de cada parcela.
A seguir apresentamos um possvel croqui de um experimento em
parcelas subdivididas com o Fator A, com 2 nveis (tratamentos principais)
aplicados s parcelas de acordo com um delineamento em blocos casualizados
com 3 repeties e o Fator B, com 3 nveis (tratamentos secundrios) aplicados
s subparcelas. Vale notar que os nveis de A so sorteados entre as duas
parcelas de cada bloco e os nveis de B so sorteados entre as trs
subparcelas de cada parcela.
BLOCO 1 BLOCO 2 BLOCO 3

Parcelas A1 A2 A2 A1 A2 A1
B1 B2 B3 B2 B1 B2
Subparcelas B3 B3 B2 B3 B3 B3
B2 B1 B1 B1 B2 B1

Se os tratamentos estivessem num esquema fatorial, o croqui poderia


ser:
BLOCO 1 BLOCO 2 BLOCO 3
A1B1 A1B2 A1B3 A2B2 A1B1 A2B2
A2B3 A1B3 A2B2 A1B3 A2B3 A1B3
A2B2 A2B1 A2B1 A1B1 A1B2 A2B1
ou seja, o delineamento em parcelas subdivididas representa uma restrio
casualizao completa existente em um ensaio fatorial envolvendo o mesmo
nmero de fatores e de nveis.
Na anlise estatstica desses experimentos, as Fontes de Variao que
fazem parte da variao entre as parcelas (Fator-A e Blocos, por exemplo) so
usualmente agrupadas separadamente daquelas que fazem parte da variao
dentro das parcelas ou entre as subparcelas (Fator-B e interao AxB). Neste
caso, temos dois resduos distintos: um referente s parcelas e outro referente
s subparcelas.

Estatstica Experimental
158

2 Anlise de varincia
No quadro a seguir, apresentaremos a partio dos graus de liberdade
de um experimento em parcelas subdivididas com a tratamentos primrios,
b tratamentos secundrios, r repeties em diferentes delineamentos para
os tratamentos aplicados s parcelas.

3 Modelo matemtico e suposies


Considerando um experimento em parcelas subdivididas envolvendo a
tratamentos primrios arranjados em um DIC com r repeties e b
tratamentos secundrios, o modelo pode ser descrito como:
Yijk i ik j ( )ij ijk , com
k 1,..., r ; i 1,..., a; j 1,..., b
sendo :
a mdia geral; i o efeito do i simo nvel de A na parcela principal
j o efeito do j simo nvel de B na sub parcela;
e ( )ij o efeito conjunto do i simo nvel de A e j simo nvel de B;
ik efeito da k sima parcela receb endo o i simonvel de A ~ N (0, 2 ) ( erro (a ) );
ijk efeito do erro aleatrio ~ N (0, 2 ) ( erro b ).
Um esquema de anlise de varincia para este modelo
Parcelas Sub-divididas no D.I.C. (r repeties)
Fonte de Variao g.l.
A (a-1)
Resduo (a) a(r-1)
(Parcelas) (ar-1)
B (b-1)
AxB (a-1)(b-1)
Resduo (b) a(r-1)(b-1)
Total abr-1

Considerando agora, um experimento em parcelas subdivididas


envolvendo a tratamentos primrios arranjados em r blocos casualizados e
b tratamentos secundrios, o modelo pode ser escrito como:

Yijk k i ik j ( )ij ijk , com


k 1,..., r ; i 1,..., a; j 1,..., b

Estatstica Experimental
159

sendo :
a mdia geral; i o efeito do i simo nvel de A, na parcela principal
j o efeito do j simo nvel de B, na sub parcela; e ( )ij o efeito conjunto de
i simo nvel de A e j simo nvel de B;
k o efeito do k simo b loco;
ik o efeito conjunto do i simo nvel de A na parcela principal no k simo b loco
e ik ~ N (0, 2 );
ijk efeito do erro aleatrio ~ N (0, 2 )
Um esquema de anlise de varincia para este modelo

Parcela Subdivida no D.B.C.(r blocos)


Fonte de Variao g.l.
Blocos (r-1)
A (a-1)
Resduo (a) (a-1)(r-1)
(Parcelas) (ar-1)
B (b-1)
AxB (a-1)(b-1)
Resduo (b) a(r-1)(b-1)
Total abr-1

4 Hiptese estatstica
As seguintes hipteses podem ser testadas nos experimentos em
parcelas subdivididas.
A hiptese de que no existe ou existe interao AB equivalente
H01 : ( )ij 0
s hipteses estatsticas
H11 : ( )ij 0 com i 1,..., a e j 1,..., b
e para test-las, usamos a estatstica
QMAB
F01 ~ F( g .l . da int erao;g .l . do Re s b ); ; ,
QM Re s(b)
a qual sob H0, tem distribuio F-Snedecor com graus de liberdade
da interao no numerador e graus de liberdade do resduo (b) no
denominador.
No DIC temos F(( a 1)( b 1);a( r 1)( b 1); ) , no DBC temos F(( a 1)( b 1);a( r 1)( b 1); ) .
A hiptese de que no existe ou existe efeito principal do fator A
H02 : i 0
,
H12 : i 0 com i 1,..., a
e para test-las, usamos a estatstica
QMA
F02 ~ F( g .l . do fator A; g .l . do Re s a ); ; ,
QM Re s(a)
a qual sob H0, tem distribuio F-Snedecor com graus de liberdade
do fator A no numerador e graus de liberdade do resduo (a) no
denominador.

Estatstica Experimental
160

No DIC temos F(( a 1); a ( r 1); ) , no DBC temos F(( a 1); ( a 1)( r 1); ) .
as hipteses de que no existe ou existe efeito principal do fator B
H 03 : j 0
,
H13 : j 0 com j 1, ..., b
e para test-las, usamos a estatstica
QMB
F03 ~ F( g .l . do fator B; g .l . do Re s b ); ; .
QM Re s(b)
que sob H0, tem distribuio F-Snedecor com graus de liberdade do
fator B no numerador e graus de liberdade do resduo (b) no
denominador.
No DIC temos F(( b 1);a( r 1)( b 1); ) , no DBC temos F(( b 1);(a( r 1)( b 1); ) .

5 Detalhes computacionais
Apresentaremos alguns passos que facilitam os clculos das somas de
quadrados da ANOVA.
No DIC:
Soma de Quadrados do Total (SQT)
r a b
(Y )2 (Y )2
SQT Yijk2 , sendo C ;
k 1 i 1 j 1 abr abr
1 a 2
Soma de Quadrados do fator A, SQ(A) SQ( A) Yi C ;
br i 1
Soma de Quadrados da Parcelas, SQ(Parc)
1 a, b
SQ(Parc ) Yij2 C ;
b i, j
SQRes(a) = SQ(Parc) SQ(A);
1 b 2
Soma de Quadrados do fator B, SQ(B) SQ(B ) Y j C ;
ar j 1
Soma de Quadrados da interao AxB, SQ(AxB)=SQ(A,B)-SQ(A)-
1 a b
SQ(B) ou SQ( AxB ) Yij2 C , sendo a SQ(A,B) a soma de
r i 1 j 1
quadrado conjunta, a qual nos fatoriais a x b igual soma de
quadrados dos tratamentos (SQTr).

SQRes(b) = SQ(Parc) SQ(B)-SQ(AB);

Para calcular os coeficientes de variao para as parcelas e para as


subparcelas usamos, respectivamente:
QM Re s( a ) QM Re s( b )
CV ( a ) x100 CV ( b ) x 100
Y Y
SQModelo
R2 x 100, sendo que SQModelo SQ( Parc ) SQ( B ) SQ( AxB )
SQT
Dos testes de hipteses sugeridos anteriormente, se ocorrer interao
AxB significativa, torna-se imprescindvel fazer o desdobramento
SQ( Bdentro de Ai ) , para i = 1, 2, ..., a ou SQ( Adentro de B j ) , para j = 1, 2, ..., b. Para

Estatstica Experimental
161

testar se as mdias de B so iguais, dentro de cada nvel de A usaremos


como denominador da estatstica F, Eb = QMRes(b), com seus a(r-1)(b-1)
graus de liberdade.
Comparaes de duas mdias de A, no mesmo ou em diferentes nveis
de B, envolve o efeito principal de A e a interao AB, ou seja, elas so ambas,
comparaes das parcelas e das subparcelas. Neste caso apropriado usar
uma mdia ponderada dos erros Ea e Eb , definida como:
QM Re s(*) (Ea (b 1)Eb
1
b
Para tais comparaes a razo da diferena dos tratamentos pelo seu
erro padro no segue uma distribuio t-student . Uma aproximao
para testar se as mdias de A so iguais, dentro de cada nvel de B usaremos
como denominador da estatstica t, o valor obtido de
QM Re s(*) (Ea (b 1)Eb , que tem n* graus de liberdade, o qual
1
b
calculado pela Frmula de Sattertwait:

n
* Ea (b 1)E b
2

Ea 2 (b 1)Eb 2
na nb
sendo, Ea QM Re s(a ), E b QM Re s(b ),
na os graus de lib erdade do erro da parcela e
nb os graus de lib erdade da sub parcela.

6 Comparaes mltiplas entre mdias de tratamentos


Aps tirarmos as concluses sobre os testes de hipteses da Anlise de
Varincia, poderemos estar interessados em comparar as mdias dos
tratamentos primrios (A), dos secundrios (B) ou da interao (AxB). Da, o
problema consiste em usar a estimativa da varincia (2) apropriada. A seguir,
apresentaremos esses problemas para os casos mais freqentes. Aqui
consideraremos a notao Ea QM Re s(a), Eb QM Re s(b)
1 Caso: entre mdias do tratamento primrio

Para testar um contraste escolhido a priori,


Y c11 c2 2 ... ca a , sendo i ( i 1,2,..., a) as mdias dos
tratamentos primrios, ou seja, H0 : Y 0 , usamos a estatstica
Yi
t ~ t( gl do Ea ) , sendo
Ea
ci
r i
2


t( gl do Ea ) o quantil de ordem (1 ) da distribuio t-student com
2
graus de liberdade do Ea.
Para testar um contraste entre duas mdias de A, Y i i , , ou
seja, H0 : Y 0 usamos a estatstica

Estatstica Experimental
162

Y
t ~ t( gl do Ea ) , sendo
2 Ea
br

t( gl do E a ) o quantil de ordem (1 ) da distribuio t-student com
2
graus de liberdade do Res(a).
Para os testes de Tukey e de Duncan usamos, respectivamente,
Ea Ea
dmsA q( a; gl do Ea ) e dmsA z( a; gl do Ea )
br br
Sendo, que q e z correspondem aos valores tabelados da
distribuio de Tukey e Duncan.

2o Caso: entre mdias do tratamento secundrio


Para testar um contraste escolhido a priori,
Y c11 c2 2 ... cb b , sendo j ( j 1,2,..., b) as mdias dos
tratamentos secundrios, ou seja, H0 : Y 0 , usamos a estatstica
Yi
t ~ t( gl do Eb ) , sendo
Eb
c i2
ar i

t( gl do E b ) o quantil de ordem (1 ) da distribuio t-student com
2
graus de liberdade do Eb.
Para testar um contraste entre duas mdias de B, Y i i , ,
usamos a estatstica
Y
t ~ t( gl do Eb ) , sendo
2
Eb
ar

t( gl do E b ) o quantil de ordem (1 ) da distribuio t-student com
2
graus de liberdade do Eb.
Para os testes de Tukey e de Duncan usamos, respectivamente,
Eb Eb
dmsB q( b; gl doEb ) dmsB z( b; gl Eb )
ar ar
Sendo que q e z correspondem aos valores tabelados da
distribuio de Tukey e Duncan.

3o Caso: entre mdias do tratamento secundrio num mesmo nvel


de i de A
Para testar um contraste escolhido a priori,
Y c1i1 c2 i 2 ... cb ib , sendo ij ( j 1,2,..., b) as mdias dos
tratamentos secundrios num mesmo nvel i de A, ou seja,
H0 : Y 0 , usamos a estatstica

Estatstica Experimental
163

Yi
t ~ t( gl do Eb ) , sendo
Eb
r
ci
2
i


t( gl do E b ) o quantil de ordem (1 ) da distribuio t-student com graus
2
de liberdade do Eb.
Para testar um contraste entre duas mdias de B num mesmo nvel
de A, Y ij ij , , usamos a estatstica

Y
t ~ t( gl do Eb ) , sendo
2 Eb
r

t( gl do E b ) o quantil de ordem (1 ) da distribuio t-student com
2
graus de liberdade do Eb.
Para os testes de Tukey e de Duncan usamos, respectivamente
Eb Eb
dms q( b; gl Eb ) dms z( b; gl do Eb )
r r
Sendo que q e z correspondem aos valores tabelados da
distribuio de Tukey e Duncan.

4o Caso: entre mdias do tratamento primrio num mesmo nvel de


B
Para testar um contraste escolhido a priori,
Yl c1 1 j c2 2 j ... ca aj , sendo ij i 1,2,..., a as mdias dos
tratamentos primrios num mesmo nvel j de B, usamos a
Yi
estatstica t * aproximadamente t( n* ) ,
Ea (b - 1)Eb
br
i c i2
Sendo n* os graus de liberdade calculados pela Frmula de
Sattertwait (o asterisco indica que esta razo no tem uma
distribuio t-student).

Para testar um contraste entre duas mdias de A num mesmo nvel


de B, Yl ij ij, , usamos a estatstica aproximada
Yi
t* aproximadamente t n *
2
Ea (b - 1)Eb
br

com n* os graus de liberdade calculados pela Frmula de


Sattertwait

Estatstica Experimental
164

Correspondentemente uma aproximao para o teste de Tukey


temos:

dms q( b, n* )
1
QMRes(a) (b-1)QMRes(b) e ,
br
sendo os valores de q e z correspondem a b tratamentos e n*
graus de liberdade para o resduo (calculados pela Frmula de
Sattertwait) e so encontrados em tabelas prprias.
EXEMPLO 1: Supor um experimento com trs raes A, B e C em seis blocos
casualizados, sendo cada parcela constituda de dois bovinos de corte. Em
uma determinada fase do experimento, os bovinos dentro de cada parcela,
passaram a receber, por sorteio, um dos dois tipos de suplementos minerais M
e P. A varivel dependente o ganho de peso no final do experimento.
Um possvel croqui deste experimento em parcelas subdivididas no
delineamento em blocos casualizados:
B A C
Bloco I
P M M P P M

A C B Bloco II
P M M P P M

B C A
P M M P M P Bloco III

A B C
M P M P P M
Bloco IV

C A B
P M M P P M Bloco V

C B A
Bloco VI
M P M P P M

1 letra fator rao e 2 letra fator suplemento mineral


BLOCOS
I II III IV V VI
BP AM BP AM CP CM
BM AP BM AP CM CP
AM CM CM BM AM BM
AP CP CP BP AP BP
CP BP AM CP BP AP
CM BM AP CM BM AM

Estatstica Experimental
165

Esquema da anlise de varincia


Causas da variao g.l.
Blocos 5
Rao (Trat. principal) A 2
Erro (a) 10
Parcelas (17)
Suplemento mineral (Trat. Secundrio) B 1
Rao x Suplemento 2
Erro (b) 15
Total 35

Os ganhos individuais ao final do experimento foram:


Blocos Rao A Rao B Rao C Total
M P M P M P
I 107 89 116 101 90 96 599
II 117 101 136 110 112 89 665
III 122 98 130 104 99 92 645
IV 111 101 122 91 105 78 608
V 90 95 117 100 110 90 602
VI 116 90 114 94 114 93 621
Total 663 574 735 600 630 538 3.740
(Veja estrutura do arquivo na ltima pgina)
Quadro de Totais I
Blocos ( 2 )* Rao A Rao B Rao C Total
I 196 217 186 599
II 218 246 201 665
II 220 234 191 645
IV 212 213 183 608
V 185 217 200 602
VI 206 208 207 621
Total 1.237 (12) 1.335 (12) 1.168 (12) 3.740
(*) Os nmeros entre parnteses representam o total de parcelas somadas para se obter os valores
observados da tabela.
Clculos para montar o quadro da anova:
37402
SQT (107 2 892 ... 932 ) 388544,44
(3 )(2 )(6 )
1 37402
SQBl (5992 6652 ... 6212 ) 582,22
6 (3 )(2 )(6 )
Para obtermos a soma de quadrados das parcelas usamos o quadro
auxiliar I com os totais de cada parcela. Como temos duas subparcelas em
cada parcela a soma de quadrados das parcelas fica
1 37402
SQParcelas (1962 2172 ... 2072 ) 2377,56
2 (3 )(2 )(6 )
Para as demais SQ, organizamos o seguinte quadro de totais II que
relaciona os nveis dos dois fatores entre si:
(6) RAO
SUPLEMENTOS A B C Totais
M 663 735 630 2028
P 574 600 538 1712
Totais 1237 1335 1168 3740
Clculos do quadro da ANOVA

Estatstica Experimental
166

1 37402
SQRaes (12372 13352 11682 ) 1173,73
12 (3 )(2 )(6 )
SQ Re s(a) SQParcelas SQBl SQRaes
2377,56 582,22 1173,73 621,61
1 37402
SQSupl (20282 17122 ) 2773,78
18 (3 )(2 )(6 )
1 37402
SQ(R, S ) (663 574 ... 538 )
2 2 2
4057,89
6 (3 )(2 )(6 )
SQ(RxS) SQ(R, S ) SQ(R ) SQ(S )
4057,89 1173,73 2773,78 110,38
SQ Re s(b) SQT SQParcelas SQSupl SQ(RxC)
799,84
Quadro da anova
Causas da variao g.l. S.Q. QM F
Blocos 5 582,22 116,44 1,87ns
Rao (Trat. Principal) A 2 1173,73 586,86 9,44**
Erro (a) 10 621,61 62,16
Parcelas (17) 2377,56
Suplemento (Trat. Secundrio) B 1 2773,78 2773,78 52,02**
Rao x Suplemento 2 110,38 55,19 1,04ns
Erro (b) 15 799,84 53,32
Total 35 6061,56
Obs. Os efeitos das raes e dos blocos so testados usando o resduo (a). Os efeitos dos suplementos e da
interao so testados usando o resduo b.
F(5,10; 0,05)=3,33 ; F(5,10; 0,01)= 5,64; F(2,10; 0,05)= 4,10; F(2,10; 0,01)= 7,56; F(1,15; 0,05)= 4,54
F(1,15; 0,01)= 8,86; F(2,15; 0,05)= 3,68; F(2,15; 0,01)= 6,36

Concluso: como a interao no foi significativa (p>0,05) devemos


interpretar as diferenas significativas dos efeitos principais da rao e do
suplemento.
Teste de Tukey:
2EA
duas mdias de A dmsA q( a, g .l .Ea .; ) , sendo EA QM Re s(a)
rb
124,32
dmsA 3,88 12,44
12
2 Eb
duas mdias de B dmsB q( b, g .l .Eb .; ) , sendo Eb QM Re s(b)
ra
106,64
dmsB 3,01 7,33
18

Quadro de mdias
(6) RAO
SUPLEMENTOS A B C Totais

Estatstica Experimental
167

M 110,5 122,5 105,0 112,7 A


P 95,7 100,0 89,7 95,1 B
Totais 103,1 ab 111,3 a 97,3 b 103,9
Mdias seguidas pela mesma letra minsculas na linha no diferem entre si pelo teste de Tukey a 5%
Mdias seguidas pela mesma letra maisculas na coluna no diferem entre si pelo teste de Tukey a 5%
Coeficientes de variaes
Q.M . Re s( a ) 62,16
CV( a ) 7 ,59%
Y 103,89
Q.M . Re s( b )
53 ,32
CV( b ) 7 ,03%
Y 103,89
Script no R para obter os resultados acima
# entrada dos dados pelo comando read.table( )
dados.ex1_10 <- read.table("ex1ps_10.txt", header=T)

# imprimindo as 6 primeiras linhas do arquivo dados.ex1_10


head(dados.ex1_10)

# anexando o objeto dados.ex1_10 no caminho de procura


attach(dados.ex1_10)

# calculo das interaes - Quadros dos totais


int.total <- tapply(gp, list(suplemento, racao), sum)
int.total

# calculo dos totais marginais do fator suplemento


total.supl<- tapply(gp,suplemento,sum)
total.supl

# calculo dos totais marginais do fator racao


total.racao<- tapply(gp,racao,sum)
total.racao

# calculo das interaes - Quadros das mdias


int.media <- tapply(gp, list(suplemento, racao), mean)
round(int.media,1)

# calculo das mdias marginais do fator suplemento


media.supl<- tapply(gp,suplemento,mean)
round(media.supl,1)

# calculo das mdias marginais do fator antibitico


media.racao<- tapply(gp,racao,mean)
round(media.racao,1)

# quadro da anova no esquema pelo comando aov()


gpps.av <- aov(gp~factor(bloco)+factor(racao)+factor(suplemento)+
factor(racao):factor(suplemento)+Error(bloco/racao))
summary(gpps.av)
# grfico da interao
interaction.plot(racao,suplemento,gp,col=2,lwd=2,

Estatstica Experimental
168

ylab="mdias de ganho de peso",xlab="raes",


main="Grfico da Interao")

# requerendo o pacote ExpDes


require(ExpDes)
split2.rbd(racao, suplemento, bloco, gp, quali = c(TRUE, TRUE),
mcomp = "tukey", fac.names = c("Rao", "Suplemento"))

# retirando o objeto dados.ex1_10 do caminho de procura


detach(dados.ex1_10)

O uso do delineamento em parcelas subdivididas desejvel quando:


O experimento pode ser usado quando um fator adicional tem de
ser incorporado em um experimento para aumentar a sua
amplitude.
Pode-se saber que as maiores diferenas podem ser esperadas de
ocorrer entre os nveis de um fator do que nos nveis do outro fator.
Neste caso, as combinaes dos tratamentos em que as grandes
diferenas so esperadas podem ser atribudas aleatoriamente s
parcelas principais simplesmente por convenincia.
O experimento usado quando grande preciso desejada para
comparaes entre os nveis de um fator do que em nveis do outro
fator.
Em resumo, dado que nos experimentos em parcelas subdivididas a
variao entre as subparcelas esperada ser menor do que a variao entre
as parcelas principais, o fator que requerer menor quantidade de material
experimental, ou que mais importante, ou que esperado apresentar
menores diferenas, ou sobre o qual desejado maior preciso por qualquer
motivo, so atribudos s subparcelas.

Estatstica Experimental
169

10 EXERCCIO PRTICO DE ESTATSTICA EXPERIMENTAL


Num experimento em parcelas subdivididas para se estudar o ganho de peso mdio dirio em
sunos foram utilizados quatro tratamentos principais ( A ) e dois secundrios ( B ), no
delineamento em blocos casualizados com cinco repeties. Os tratamentos principais, raes
A1, A2, A3, e A4 foram aplicadas as parcelas constitudas de seis sunos cada uma logo aps a
desmama. Decorridos trinta dias, trs sunos de cada parcela passaram a receber por sorteio
uma suplementao alimentar, com dois tipos de vitaminas B1 e B2 .
Ao final do experimento os aumentos de peso mdio dos trs animais por subparcela em
quilogramas esto dados na tabela abaixo:
Tratamentos 1 Bloco 2 Bloco 3 Bloco 4 Bloco 5 Bloco Total
A1 B1 1,30 1,35 1,28 1,25 1,32 6,50
B2 1,32 1,35 1,29 1,31 1,35 6,62
A2 B1 1,10 1,15 1,12 1,18 1,11 5,66
B2 1,20 1,21 1,15 1,18 1,20 5,94
A3 B1 1,45 1,48 1,45 1,44 1,46 7,28
B2 1,48 1,45 1,47 1,50 1,41 7,31
A4 B1 1,22 1,24 1,24 1,30 1,22 6,22
B2 1,24 1,23 1,25 1,28 1,26 6,26
Total 10,31 10,46 10,25 10,44 10,33 51,79
4 2
Obs. y
i 1 j 1
2
ij 67.56730 Usar 5 casas decimais para os clculos.

a) Estabelecer as hipteses estatsticas, reproduza os resultados do quadro abaixo, o grfico


da interao, fazer a anlise de varincia e concluir. Caso haja interao fazer os
desdobramentos necessrios e os testes de comparaes mltiplas.
b) Calcule as mdias dos tratamentos principais, os erros padres e compare-as pelo teste de
Tukey a 5% de probabilidade.
c) Calcule os coeficientes de variao ( C.V. ) e de determinao ( R2 ) do experimento.
Quadros auxiliares:
1)
(2) I II III IV V Total
A1 2,62 2,70 2,57 2,56 2,67 13,12
A2 2,30 2,36 2,27 2,36 2,31 11,60
A3 2,93 2,93 2,92 2,94 2,87 14,59
A4 2,46 2,47 2,49 2,58 2,48 12,48
Total 10,31 10,46 10,25 10,44 10,33 51,79
2)
(5) A1 A1 A1 A1 Total
B1 6,50 5,66 7,28 6,22 25,66
B2 6,62 5,29 7,31 6,26 26,13
Total 13,12 11,60 14,59 12,48

2) Cinco jumentos foram utilizados, dentro do manejo regular de colheita de smem com o
qual j estavam acostumados, para testar sobre o primeiro ejaculado, trs diferentes diluentes
e aps as diluies, trs diferentes tempo de conservao do material (5C). A resposta medida
foi a motilidade observada no smem em funo daqueles fatores. Para cada jumento, o
primeiro ejaculado foi divido em trs alquotas, diludas cada uma em um dos diluentes e este
volume novamente dividido em outras trs alquotas, uma para cada tempo de conservao.
Percebe-se que a parcela definida pelo diluente e dentro dele, as trs subparcelas
correspondentes aos tempos. Trata-se portanto de um delineamento em parcelas subdivididas
, em que cada jumento assume o papel de um bloco, j que pela utilizao de alquotas todos
os tratamentos (diluentes) provm de um mesmo ejaculado.

DILUENTE

Estatstica Experimental
170

A B C
ANIMAL T1 T2 T3 T1 T2 T3 T1 T2 T3
1 75 73 66 214 81 75 62 218 68 61 50 179
2 65 60 61 186 69 62 51 182 60 55 50 165
3 78 83 70 231 79 76 60 215 72 68 61 201
4 68 61 51 180 76 66 51 193 61 57 53 171
5 44 43 37 124 55 51 41 147 34 24 21 79
Total 330 320 285 935 360 330 265 955 295 265 235 795
3 3 3 3

I 1 j 1
Yij2 169173 ; Y I 1 j 1
ij 2685 YLinear ( i ) ( 1 ) I1 ( 0 ) I 2 (1 ) I 3

a) Checar os resultados das frmulas acima e preencher os quadros auxiliares abaixo.


b) Estabelecer as hipteses estatsticas e fazer a anlise de varincia e concluir.
c) No grfico abaixo teste a significncia da tendncia linear dos valores mdios da motilidade
em cada diluente.
d) Calcule os coeficientes de variao do experimento.
Quadros auxiliares: 1)
Jumentos (Blocos)
( ) I II III IV V Total
A
B
C
Total
2)
( ) T1 T2 T3 Mdia
A
B
C
Mdia
M
ot
dadeobser
l
i vadaem
sm
emdej
ument
ossegundoodi
ui
l dor
eot
empo
74

68

62
Motildade

56

50

A
44
B
6 10 14 18 22 26 30 34 38 C

T
empo

Estatstica Experimental
171

Aula 11 Experimentos em parcelas subdivididas - Anlise de medidas


repetidas no tempo.
Como nos experimentos em parcelas subdvididas, experimentos
utilizando delineamentos de medidas repetidas no tempo tm estruturas que
envolvem mais de um tamanho de unidade experimental. Por exemplo, um
animal pode ser observado durante certo perodo de tempo, onde tempo um
dos fatores na estrutura de tratamentos do experimento. Tais dados so
anlogos aos dados de um experimento em parcela subdividida em muitos
aspectos e sua anlise frequentemente conduzida tal como um experimento
em parcela subdividida e denominado como parcela subdividida no tempo, ou
anlise de medidas repetidas no tempo.
Exemplo: um experimento envolvendo 3 drogas foi conduzido para
estudar cada efeito de droga no batimento cardaco dos animais. Depois que
cada droga era administrada, o batimento cardaco era medido de 5 em 5
minutos durante 20 minutos.
DA DB DC
Animais T5 T10 T15 T20 T5 T10 T15 T20 T5 T10 T15 T20
1 78 86 81 77 85 86 83 80 69 73 72 74
2 71 83 88 81 82 86 80 84 66 62 67 73
3 72 82 81 75 71 78 70 75 84 90 88 87
4 72 83 83 69 83 88 79 81 80 81 77 72
5 66 79 77 66 86 85 76 76 72 72 69 70
6 74 83 84 77 85 82 83 80 65 62 65 61
7 62 73 78 70 79 83 80 81 75 69 69 68
8 69 75 76 70 83 84 78 81 71 70 65 65
Quadro auxiliar 1) Totais das parcelas
Animais Total
DA 322 323 310 307 288 318 283 290 2441
DB 334 332 294 331 323 330 323 326 2593
DC 288 268 349 310 283 253 281 271 2303
Total 944 923 953 948 894 901 887 887 7337
Quadro auxiliar 2) Totais dos fatores
T5 T10 T15 T20 Total
DA 564 644 648 585 2441
DB 654 672 629 638 2593
DC 582 579 572 570 2303
Total 1800 1895 1849 1793 7337

Clculo das somas de quadrados do quadro da ANOVA:


7337 2
SQT ( 78 2 86 2 ... 65 2 )
( 3 )( 4 )( 8 )
Do QUADRO I, temos
1 7337 2
SQParcelas ( 322 2 323 2 ... 2712 ) 3604,24
4 ( 3 )( 4 )( 8 )
1 7337 2
SQDroga ( 2441 ... 2303 )
2 2
1315,08
32 ( 3 )( 4 )( 8 )
SQErro ( a ) S.Q.parcelas S.Q.Droga 3604,24 1315,08 2289,16

Do QUADRO II, temos


1 7337 2
SQTempo (18002 1895 2 ... 1793 2 ) 282,61
24 ( 3 )( 4 )( 5 )

Estatstica Experimental
172

1 7337 2
SQConjunta ( 564 644 ... 570 )
2 2 2
2128,86
8 ( 3 )( 4 )( 8 )

SQ( Droga x Tempo) SQConjunta SQDroga SQTempo


2128,86 1315,08 282,61
531,17
SQErro ( b ) SQT SQParcelas SQTempo SQ( Droga x Tempo)
4907,49 3604,24 282,61 531,17 489,47
Quadro da ANOVA
F.V. G.L. S.Q. Q.M. F p
DROGA 2 1315,08 657,54 6,03** 0.008512
Erro(a) 21 2289,16 109,01
PARCELAS 23 3604,24 156,71 20,15**
TEMPO 3 282,81 94,27 12,12** 2.315e-06
DROGA x TEMPO 6 531,17 88,53 11,39** 1.381e-08
Erro(b) 63 489,47 7,78
TOTAL 95 4907,49
F(2, 21; 0,05) = 3,47 F(2, 21; 0,01) = 5,78 F(3, 63; 0,05) = 2,76 F(3, 63; 0,01) = 4,13
F(6, 63; 0,05) = 2,25 F(6, 63; 0,01) = 3,12
Concluso: existe uma interao tempo*droga significativa (p<0,01);
ento devemos comparar os tempos em cada droga e drogas em cada tempo.
Script no R para os clculos acima
# entrada dos dados pelo comando read.table( )
dados.ex1_11 <- read.table("ex1mr_11.txt", header=T)

# imprimindo as 6 primeiras linhas do arquivo dados.ex1_10


head(dados.ex1_11)

# anexando o objeto dados.ex1_11 no caminho de procura


attach(dados.ex1_11)

# calculo das interaes - Quadros dos totais


int.total <- tapply(fc, list(droga,tempo), sum)
int.total

# calculo dos totais marginais do fator suplemento


total.droga<- tapply(fc,droga,sum)
total.droga

# calculo dos totais marginais do fator racao


total.tempo<- tapply(fc,tempo,sum)
total.tempo

# calculo das interaes - Quadros das mdias


int.media <- tapply(fc, list(droga, tempo), mean)
round(int.media,1)

# calculo das mdias marginais do fator suplemento


media.droga<- tapply(fc,droga,mean)
round(media.droga,1)

Estatstica Experimental
173

# calculo das mdias marginais do fator antibitico


media.tempo<- tapply(fc,tempo,mean)
round(media.tempo,1)

# quadro da anova no esquema pelo comando aov()


fc.av <- aov(fc~factor(droga)+factor(tempo)+
factor(droga):factor(tempo)+Error(droga:animal))
summary(fc.av)

# grfico da interao
interaction.plot(tempo,droga,fc,col=2,lwd=2,
ylab="mdias da frequncia cardaca",xlab="tempo",
main="Grfico da Interao")

# requerendo o pacote ExpDes


require(ExpDes)
split2.crd(droga, tempo, animal, fc, quali = c(TRUE, TRUE),
mcomp = "tukey", fac.names = c("Droga", "Tempo"))

# retirando o objeto dados.ex1_11 do caminho de procura


detach(dados.ex1_11)

Para comparar tempo em cada droga, o erro padro da diferena de


duas mdias
2E ( b ) 2( 7 ,78 )
S.E .( Yij . Yil . ) 1,39 ,
r 8
e o teste de tukey dado por
dms q(3,63;0,05 )S.E.(Yij. Yil. ) (3,39)(1,39) 4.73
Do quadro auxiliar das mdias temos,
T5 T10 T15 T20
DA 70,50b 80,50 81,00a 73,13b
DB 81,75a 84,00a 78,63a 79,75a
DC 72,75b 72,38b 71,50b 71,25b
Mdias com a mesma letra minscula nas linhas no diferem entre si pelo teste de Tukey a 5%.
Assim do quadro auxiliar das mdias temos,
T5 T10 T15 T20
DA 70,50bB 80,50aA 81,00aA 73,13abB
DB 81,75aA 84,00aA 78,63aA 79,75aA
DC 72,75aB 72,38aB 71,50aB 71,25aB
Mdias com a mesma letra minscula nas colunas no diferem entre si pelo teste de Tukey a 5%.
Mdias com a mesma letra maiscula nas colunas no diferem entre si pelo teste de Tukey a 5%.
Dado que os nveis do fator tempo so quantitativos e igualmente
espaados, polinmios ortogonais podem ser usados para checar a tendncia
linear e quadrtica na resposta de cada droga

Estatstica Experimental
174

A tendncia linear para a Droga B (DB) definida pelo contraste


YLinear 3Y21 1Y22 1Y23 3Y24
( 3 )(81,75 ) ( 1)(84,00 ) (1)(78,63 ) (3 )(79,75 ) 11,37
com erro padro do contraste dado por:
7,78
SY ((3 )2 ( 1)2 12 3 2 ) 4,41
Linear
8
A estatstica t-student correspondente
Y 11,37
tCalc. Linear 2,58 ,
SY 4,41
Linear

o valor tabelado t(63; 0,05) = 2,00. Conclumos, ento, que a tendncia linear
negativa observada no grfico para a Droga B (DB) significativa (p<0,05) pelo
teste t-student.
A tendncia quadrtica para a Droga a (DA) pode ser definida pelo
contraste
YQuad . 111 112 113 114

o qual estimado por


YQuad 1Y11 1Y12 1Y13 1Y14 17,87
com erro padro do contraste dada por:
7,78
SYuad. (12 ( 1)2 ( 1)2 12 ) 1,97
8
a estatstica t-student correspondente
YQuad 17,87
tCalc. 9,07

S.E.(YQuad . ) 1,97
o valor tabelado t(63; 0,05) = 2,00. Conclumos, ento que a forte tendncia
quadrtica observada no grfico para a Droga A (DA) significativa (p<0,05)
pelo teste t-student.

Estatstica Experimental
175

Aula 12 Transformao de dados

1 Introduo
Existem duas maneiras nas quais as hipteses da ANOVA podem ser
violadas. Primeiro, os dados podem consistir de medidas em uma escala
ordinal ou nominal; neste caso mtodos mais apropriados para dados ordinais
e nominais so necessrios. Segundo, os dados, embora medidos em escala
contnua, podem no satisfazer pelo menos uma das trs hipteses requeridas
pela anlise de varincia:
Como vimos anteriormente, as hipteses da anlise de varincia so:
os termos dos erros so aleatriamente, independentemente e
normalmente distribudos eij ~ N( 0 , 2 )
a varincia de diferentes amostras so homogneas; varincias e
mdias de diferentes amostras no so correlacionadas;
os efeitos dos tratamentos so aditivos.

Nestes casos, duas opes se oferecem para analisar os dados. Uma


reduzir o intervalo dos dados para dados medidos em uma escala nominal ou
ordinal apropiada e fazer uma anlise para este tipo de dado. A outra
possibilidade ver se os dados podem ser transformados para satisfazer as
hipteses da ANOVA. Se tal transformao encontrada, os dados
transformados podem ento serem analisados pelos mtodos da ANOVA. A
hiptese de varincias iguais essencial para a realizao da anlise de
varincia. Em muitos casos a transformao que torna as varincias mais
homogneas, tambm tornam os dados mais prximos de uma distribuio
normal.
Considere o exemplo, no qual os pesos, em pounds, de animais, em um
DBC, foram observados. Os tratamentos esto em um esquema fatorial 3 x 2,
trs espcies de animais e dois grupos, um tratado com uma nova vitamina e
outro contrle, em 4 blocos

Bloco
Tratamentos I II III IV
mice contrle 0.18 0.30 0.28 0.44
mice vitamina 0.32 0.40 0.42 0.46
galinha controle 2.0 3.0 1.8 2.8
galinha vitamina 2.5 3.3 2.5 3.3
ovelha controle 108.0 140.0 135.0 165.0
ovelha vitamina 127.0 153.0 148.0 176.0

O quadro da anova dos dados deste experimento mostra os seguintes


resultados

Df Sum Sq Mean Sq F value Pr(>F)


factor(bloco) 3 984 328 2.631 0.0881 .
factor(fatorA) 2 108321 54161 434.507 5.28e-14 ***
factor(fatorB) 1 142 142 1.140 0.3025
factor(fatorA):factor(fatorB) 2 250 125 1.004 0.3896
Residuals 15 1870 125
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Estatstica Experimental
176

A alta significncia entre as espcies (fatorA) no surpreendente para


o pesquisador. O que parece estranho que no foi detectada diferena
significativa devido a vitamina (fatorB), tendo em vista que todo animal em
todas as replicaes que receberam vitamina mostraram um peso maior do que
o correspondente animal contrle. Parece estranho tambm que no foi
encontrado evidncias de interao entre os efeitos de vitamina e espcies,
dado que a resposta aparente a vitamina to diferente nas diferentes
espcies. Tudo que podemos concluir que mice, galinhas e ovelhas diferem
em peso.
Vamos olhar estes dados com as supsies da anova em mente e ver o
que podemos fazer se uma das suposies no atendida.

O grfico de resduos vs valores preditos mostra claramente uma


heterogeneidade de varincias e o QQ-plot mostra um comportamento dos
dados que no muito convicente da distribuio normal. A menssagem
parece clara, entretanto, podemos ainda fazer testes para verificar o desvio dos
pressupostos.
Teste de normalidade de normalidade de Shapiro-Wilk no R

# teste de normalidade
shapiro.test(pesotrat.av$res)
Sada fornecida pelo R:

Shapiro-Wilk normality test

data: pesotrat.av$res
W = 0.9536, p-value = 0.3236
Este teste mostra o teste no significativo (p=0,3236), portanto no
rejeitamos H0 : ij ~ N(0, 2 ) , ou seja, os resduos e por conseguinte os dados
deste experimento suportam a suposio de normalidade. Assim, a primeira
suposio prenchida.

Estatstica Experimental
177

Agora vamos examinar a suposio de homogeneidade das varincias.


Vamos aplicar o teste de Bartlett usando o R.

# teste da homogeneidade das varincias dos tratamentos


bartlett.test(peso~factor(trat))

Sada do teste de Bartlett no R:


Bartlett test of homogeneity of variances

data: peso by factor(trat)


Bartlett's K-squared = 81.8698, df = 5, p-value = 3.408e-16

O teste significativo (p=3.408e-16), rejeitamos H0 : 12 ... 62 , ou


seja, as varincias dos tratamentos no so homocedsticas (homogneas).
Logo, a segunda suposio no observada nos dados deste
experimento. Para tentar contornar o problema vamos usar a transformao
Box-Cox, que consiste em transformar os dados de acordo com a expresso

y 1
y'

sendo um parmetro a ser estimado dos dados. Se 0 a equao
acima se reduz a
y ' ln(y )
sendo ln o logaritmo neperiano. Uma vez obtido o valor de encontramos
os valores dos dados transformados conforme a equao acima e utilizamos
estes dados transformados para efetuar as anlises. A funo boxcox() do
pacote MASS calcula a verossimilhanca perfilhada deste parmetro. Devemos
escolher o valor que maximiza esta funo. Nos comandos a seguir
comeamos carregando o pacote MASS e depois obtemos o grfico da
verossimilhanca perfilhada no R:

# requerendo o pacote MASS


require(MASS)
boxcox(peso ~ factor(trat),plotit = T)
Estes comandos fornecem o grfico da verossimilhana perfilada

Como estamos interessados no mximo da funo vamos dar um zoom


no grfico com o comando
# zoom no grfico par maiores detalhes do valor do parmetro

Estatstica Experimental
178

boxcox(a_peso ~ racoes, lam = seq(1,2, 1/10))

O grfico mostra que o valor que maximiza a funo aproximadamente


0,1. Assim, prximo passo obter os dados transformados e depois fazer as
analise utilizando estes novos dados.

# obteno dos dados transformados


lambda<-0.1
peso.trans <- (peso^(lambda) - 1)/lambda

# fazendo a anlise de varincia dos dados transformados


peso.avtrans <- aov(peso.trans ~ factor(trat)
summary(peso.avtrans)
plot(peso.avt)

O quadro da anova dos dados transformados mostra o seguinte quadro


da anova
Df Sum Sq Mean Sq F value Pr(>F)
factor(bloco) 3 0.85 0.28 18.244 2.88e-05 ***
factor(fatorA) 2 237.35 118.68 7678.808 < 2e-16 ***
factor(fatorB) 1 0.31 0.31 19.879 0.00046 ***
factor(fatorA):factor(fatorB) 2 0.02 0.01 0.502 0.61518
Residuals 15 0.23 0.02
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Este quadro mostra um resultado mais satisfatrio do que a anlise dos


dados sem transformao. Nesta anlise, tambm mostrado uma
significncia do fator B (p=0,00046). Mesmo assim, o resultado do teste da
significncia da interao (p = 0,61518) permaneceu no significativo.
NOTA: No grfico da verossimilhana perfilhada notamos que mostrado um
intervalo de confiana para e que o valor 0 est contido neste intervalo. Isto
indica que podemos utilizar a transformao logaritmica dos dados e os
resultados da anova sero bem prximos dos obtidos com a transformao
com 0,1 , prviamente adotada.

# quadro da anova dos dados transformados

Estatstica Experimental
179

pesolog.av <-
aov(log(peso+1)~factor(bloco)+factor(fatorA)+factor(fatorB)+
factor(fatorA):factor(fatorB))
summary(pesolog.av)

Df Sum Sq Mean Sq F value Pr(>F)


factor(bloco) 3 0.22 0.07 12.85 0.000201 ***
factor(fatorA) 2 96.89 48.44 8573.72 < 2e-16 ***
factor(fatorB) 1 0.07 0.07 12.11 0.003361 **
factor(fatorA):factor(fatorB) 2 0.00 0.00 0.41 0.670832
Residuals 15 0.08 0.01
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Reparem que os resultados desta anova esto bem prximos dos


resultados da anova dos dados originais.
Teste de normalidade de Shapiro-Wilk nos resduos dos dados
transformados

# teste da normalidade
shapiro.test(pesolog.av$res)

Shapiro-Wilk normality test


data: pesofattrans.av$res
W = 0.9803, p-value = 0.9014

Teste de da homogeneidade das varincias dos tratamentos


# teste de bartlett
bartlett.test(log(peso+1)~factor(trat))
O resultado do teste de Bartlett para os dados transformados

Bartlett test of homogeneity of variances


data: log(peso + 1) by factor(trat)
Bartlett's K-squared = 5.5714, df = 5, p-value = 0.3502

Agora temos confiana de que a nova anlise de varincia vlida, dado


que dados transformados satisfazem as duas suposies da anlise de
varincia. Com os dados originais a homogeneidade das varincias no era
atendida.

Estatstica Experimental

Você também pode gostar