Você está na página 1de 72

PLANEJAMENTO DE EXPERIMENTOS:

CONCEITOS E APLICAC

OES
CL

OVIS DE ARA

UJO PERES
MARIA REGINA MADRUGA
H

ELITON RIBEIRO TAVARES


ii
Planejamento de Experimentos:
Conceitos e Aplicac oes
Clovis de Ara ujo Peres
1
Heliton Ribeiro Tavares
2
Maria Regina Madruga Tavares
3
1
Professor Titular da Universidade Federal de Sao Paulo (Unifesp). e-mail: cperes@medprev.epm.br
2
Professor Adjunto do Departamento de Estatstica da Universidade Federal do Para
(UFPA). e-mail: heliton@ufpa.br
3
Professor Adjunto do Departamento de Estatstica da Universidade Federal do Para
(UFPA). e-mail: madruga@ufpa.br
Peres, Tavares & Madruga
iii
Para
Nossos lhos(as) e companheiros(as).
Peres, Tavares & Madruga
Apresentacao
A area de Planejamento de Experimentos e uma das mais necessarias na vida cientca.
Ela comporta a propria fase de planejamento de um estudo, bem como a de analise dos
resultados numericos do estudo.
Conte udo
Apresenta cao v
Lista de Figuras ix
1 Introducao 1
1.1 Enunciado do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Escolha dos fatores e seus respectivos nveis . . . . . . . . . . . . . . . . . . 2
1.3 Escolha da unidade experimental . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Escolha das variaveis a serem medidas . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Regras de atribuicao das unidades experimentais . . . . . . . . . . . . . . . . 4
1.6 Aleatorizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.7 Repeticao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.8 Analise estatstica dos resultados . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 Experimentos com um fator 9
2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Experimentos com um fator xo . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Suposicoes associadas ao modelo . . . . . . . . . . . . . . . . . . . . . 11
2.2.3 Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.4 Parti cao da soma de quadrados total e graus de liberdade . . . . . . . 12
2.2.5 Quadrados medios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.6 Esperancas dos quadrados medios (EQM) . . . . . . . . . . . . . . . . 14
2.2.7 Estatstica e regiao crtica do teste . . . . . . . . . . . . . . . . . . . . 14
2.2.8 Quadro da analise de variancia (ANOVA) . . . . . . . . . . . . . . . . 15
2.2.9 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.10 Estimacao das medias dos tratamentos . . . . . . . . . . . . . . . . . . 16
2.2.11 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.12 Comparacoes m ultiplas . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.13 Analise de Resduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3 Experimentos com um fator Aleatorio . . . . . . . . . . . . . . . . . . . . . . 28
2.3.1 Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.2 Suposicoes do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
viii Conte udo
2.3.3 Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.4 Parti cao da soma dos quadrados total e graus de liberdade . . . . . . 32
2.3.5 Esperancas dos quadrados medios . . . . . . . . . . . . . . . . . . . . . 32
2.3.6 Estatstica e regiao crtica do teste . . . . . . . . . . . . . . . . . . . . 32
2.3.7 Quadro de Analise de Variancia . . . . . . . . . . . . . . . . . . . . . . 32
2.3.8 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3.9 Estimacao em experimentos com um fator aleatorio . . . . . . . . . . . 33
2.3.10 Estimacao de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.11 Estimacao de
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.12 Estimacao de
2
A
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.13 Estimacao de

2
A

2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3.14 Estimacao de

2
A

2
A
+
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3.15 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Experimentos com Dois Fatores 39
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Notacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3 Experimentos cruzados xos . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3.1 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.2 Suposicoes associadas ao modelo . . . . . . . . . . . . . . . . . . . . . 42
3.3.3 Interpreta cao dos parametros do modelo . . . . . . . . . . . . . . . . . 43
3.3.4 Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3.5 Parti cao da soma dos Quadrados Total . . . . . . . . . . . . . . . . . . 44
3.3.6 Esperanca dos quadrados medios (EQM) . . . . . . . . . . . . . . . . . 45
3.3.7 Estatsticas e regioes crticas par os testes . . . . . . . . . . . . . . . . 46
3.3.8 Anova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.3.9 Estimacao dos parametros do modelo . . . . . . . . . . . . . . . . . . 47
3.3.10 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.4 Experimentos cruzados aleatorios e cruzados mistos . . . . . . . . . . . . . . 51
3.5 Experimentos hierarquicos xos . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.5.1 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.5.2 Suposicoes e restricoes associadas ao modelo . . . . . . . . . . . . . . . 53
3.5.3 Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.5.4 Parti cao da soma do Quadrado Total . . . . . . . . . . . . . . . . . . . 54
3.5.5 Esperanca dos Quadrados Medios . . . . . . . . . . . . . . . . . . . . . 54
3.5.6 Estatsticas e regiuoes crticas pra os testes de H
01
e H
02
. . . . . . . 55
3.5.7 Anova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.6 Experimentos hierarquicos aleatorios e Experimentos hierarquicos mistos . . 55
3.6.1 Analise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.6.2 Exemplo(SEA-8025) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Peres, Tavares & Madruga
Lista de Figuras
2.1 Ilustracao das suposicoes do modelo matematico associado a um experi-
mento com um fator xo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Resduos para cada grupo de gestantes (dados da Tabela 2.7) . . . . . . . . 29
2.3 Normal plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4 Resduos segundo a ordem de obtencao das observacoes no estudo da HbA
em gestantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1 Gracos de Pers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 Pers de medias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Captulo 1
Introducao
Em uma pesquisa cientca o procedimento geral e formular hipoteses e verica-las
diretamente ou por suas conseq uencias. Para isto e preciso um conjunto de observacoes e
o planejamento de experimentos e entao essencial para indicar o esquema sob o qual as
hipoteses possam ser vericadas. As hipoteses sao vericadas com a utilizacao de metodos
de analise estatstica que dependem da maneira sob a qual as observa coes forma obtidas.
Portanto, planejamento de experimentos e analise dos resultados estao intimamente ligados
e devem ser utilizadas em seq uencia nas pesquisas cientcas das diversas areas do conhe-
cimento. Isto pode ser visto por meio da seguinte representacao graca da circularidade
do metodo cientco:
Fica bastante claro neste esquema que tecnicas de planejamento devem ser utilizadas
entre as etapas (1) e (2) e os metodos de analise estatstica devem ser utilizados na etapa
(3).
Desenvolvendo um pouco mais esta ideia podemos dizer que uma pesquisa cientca
estatisticamente planejada consiste nas seguintes etapas que dependem de um perfeito
entendimento entre o pesquisador e o estatstico:
1. Enunciado do problema com formula cao de hipoteses.
2. Escolha dos fatores (variaveis independentes) que devem ser includos no estudo.
3. Escolha da unidade experimental e da unidade de observacao.
4. Escolha das variaveis que serao medidas nas unidades de observacao.
5. Determinacao das regras e procedimentos pelos quais os diferentes tratamentos (com-
binacao de nveis de fatores) sao atribudos `as unidades experimentais (ou vice-versa).
6. Analise estatstica dos resultados.
7. Relatorio nal contendo conclusoes com medidas de precisao das estimativas, inter-
pretacao dos resultados com possvel referencia a outras pesquisas similares e uma
avalia cao dos tens de 1 a 6 (desta pesquisa) com sugestoes para possveis alteracoes
em pesquisas futuras.
2 Introducao
A seguir ilustraremos com exemplos estas etapas.
1.1 Enunciado do problema
Como vimos, uma pesquisa cientca se inicia sempre com a formulacao de hipoteses.
Essas hipoteses sao primeiramente formuladas em termos cientcos dentro da area de es-
tudo (hipotese cientca) e em seguida devem ser expressas em termos estatsticos (hipotese
estatstica). Deve haver uma correspondencia perfeita entre as hipoteses cientca e es-
tatstica para evitar ambiguidade.
Portanto, no enunciado do problema, a hipotese cientca deve ser formulada de maneira
precisa e objetiva.
EXEMPLO 1.1 - Um pesquisador esta interessado em estudar o efeito de varios tipos de
racao que diferem pela quantidade de potassio no aumento do peso de determinado tipo
de animal.
Esse objetivo pode ser atingido se planejarmos a pesquisa com uma das seguintes na-
lidades:
a) comprar as medias dos aumentos de peso obtidas com cada uma das racoes (igual-
dade de media):
b) estabelecer uma relacao funcional entre o aumento de peso medio e a quantidade
de potassio.
1.2 Escolha dos fatores e seus respectivos nveis
No exemplo 1.1, a variavel independente racaoe um fator e os tipos de racao sao os
nveis deste fator, ou tratamentos. Assim, em um experimento para se estudar o efeito de
4 fertilizantes e 3 variedades de feijao na producao, teramos dois fatores: fertilizante, com
4 nveis, e variedade, com 3 nveis. Podemos tambem dizer que este experimento envolve
12 tratamentos correspondentes `as combina coes dos nveis dos dois fatores. Pelo proprio
conceito de fator, vemos que em um esperimento, a escolha dos fatores e seus respectivos
nveis (que farao parte de um experimento) e basicamente um problema do pesquisador.
No entanto e importante para o planejamento e analise disting uirmos as duas situacoes
abaixo:
EXEMPLO 1.2 - Uma ind ustria de parafusos adquiriu 5 maquinas de uma determinada
marca para produzir parafusos, e esta interessada em realizar um experimento para veri-
car se as 5 maquinas sao homogeneas com relacao a resistencia media dos parafusos por
elas produzidas.
EXEMPLO 1.3 - A ind ustria das maquinas do Exemplo 1.2 esta interessada em realizar
um experimento para vericar se as maquinas produzidas por ela sao homogeneas com
Peres, Tavares & Madruga
1.3 Escolha da unidade experimental 3
relacao `a resistencia media dos parafusos que estas maquinas irao produzir. Como a po-
pulacao de maquinas produzidas pela ind ustria e muito grande o pesquisador quer realizar
o experimento com uma amostra de maquinas (5 por exemplo), mas as conclusoes devem
ser estendidas para a populacao de maquinas.
No Exemplo 1.2 dizemos que o fator maquinae xo e no Exemplo 1.3 o fator maquinae
aleatorio.
A diferenca fundamental entre esses dois tipos de fatores e, entao , que no caso de
fatores xos, as conclusoes se referem apenas aos nveis do fator que estao presentes no
experimento. No caso de fatores aleatorios as conclusoes devem ser estendidas para a
populacao dos nveis.
1.3 Escolha da unidade experimental
Em um grande n umero de situacoes praticas a unidade experimental e determinada
pela propria natureza do material experimental. Por exemplo, em experimentos com ani-
mais, em geral, a unidade experimental e um animal. Em outras situacoes, a escolha da
unidade nao e assim tao evidente, exigindo do pesquisador juntamente com o estatstico
algum estudo no sentido escolher a unidade experimental mais adequada. Por exemplo,
em experimentos com plantas, a unidade experimental pode ser `as vezes uma planta, um
conjunto de plantas ou uma area. A escolha da unidade experimental, de um modo ge-
ral, deve ser orientada no sentido de minimizar o erro experimental, isto e, as unidades
experimentais devem ser o mais homogeneas possvel, para que quando submetidas a dois
tratamentos diferentes, seus efeitos sejam facilmente detectados.
1.4 Escolha das variaveis a serem medidas
As medidas realizadas nas unidades experimentais apos terem submetidas aos trata-
mentos constituem os valores da variavel dependente. A variavel dependente, em geral,
e pre-determinada pelo pesquisador, isto e, ele sabe qual a variavel que ele quer medir.
O que constitui problema, `as vezes, e a maneira como a variavel e medida, pois disto
dependem a precisao das observacoes, e a distribuicao de probabilidade da variavel a qual
e essencial para a escolha do metodo de analise estatstica. Assim, por exemplo, se os
valores de uma variavel sao obtidos diretamente por meio de um instrumento de medida,
(reguas, paqumetro, termometro, etc.) a precisao de nossas observa coes vai aumentar se,
quando possvel, utilizarmos como observacao a media de tres medidas da mesma unidade
experimental. Com relacao `a distribuicao de probabilidade, em muitas situacoes, as ob-
servacoes nao sao obtidas diretamente, e sim por meio de expressoes matematicas que as
ligam a outro valores obtidos diretamente. Neste caso, a distribuicao de probabilidade das
observacoes vai depender da distribuicao de probabilidade da variavel obtida diretamente
e da expressao matematica que as relaciona.
Portanto, as variaveis necessariamente presentes em um experimento sao a variavel
Peres, Tavares & Madruga
4 Introducao
dependente, medida nas unidades experimentais, e o conjunto de fatores (variaveis inde-
pendentes), que determinam as condicoes sob as quais os valores da variavel dependente
sao obtidos. Qualquer outra variavel que possa inuir nos valores da variavel dependente
deve ser mantida constante. Suponhamos, por exemplo, que o tempo necessario para exe-
cutar um experimento seja de 20 dias e que a temperatura ambiente tenha inuencia sobre
a variavel dependente.
Neste caso, a temperatura ambiente deve ser mantida constante durante a execucao do
experimento. Se, por problemas experimentais, for impossvel mantermos a temperatura
ambiente constante, entao devemos, alem da variavel dependente, medir a temperatura
correspondente a cada unidade experimental. Variaveis deste tipo sao consideradas no
estudo como covariadas e sua informacao e utilizada para reduzir o erro experimental.
1.5 Regras segundo as quais os tratamentos sao atribudos
`as unidades experimentais
Nas discussoes apresentadas sobre cada um dos tens anteriores, a colaboracao da es-
tatstica e bem limitada exigindo-se a essencial colaboracao do pesquisador. Porem, o
assunto discutido neste tem e o que poderamos denominar planejamento estatstico de
experimentos. Trata-se de regras que associam as unidades experimentais aos tratamen-
tos e que praticamente determinam os diferentes planos experimentais. Lembramos neste
ponto que os tratamentos sao cada uma das combinacoes entre os nveis de todos os fatores
envolvidos no experimento.
Para que a metodologia estatstica possa ser aplicada aos resultados de um experimento
e necessario, que em alguma fase do experimento o princpio a ser obedecido e a repeticao,
segundo o qual devemos ter repeticoes do experimento para que possamos produzir uma
medida de variabilidade necessaria aos testes de presenca de efeitos de tratamentos ou `a
estimacao desses efeitos. Discutiremos a seguir estes dois princpios.
1.6 Aleatorizacao
Nesta fase do planejamento de um experimento ja sabemos quais fatores serao estuda-
dos e o n umero de nveis de cada fator que estarao presentes no experimento. Sabemos
ainda qual a unidade experimental escolhida e a variavel dependente. Podemos entao ima-
ginar que de um lado temos um conjunto U de unidades experimentais, e de outro lado
um conjunto T de tratamentos que sao as combina coes dos nveis de todos os fatores
envolvidos. Precisamos entao estabelecer esquemas que associam subconjuntos de elemen-
tos de U a cada elemento de T. Passaremos a discutir alguns destes esquemas. No que
segue vamos supor que o conjunto U tem n elementos, o conjunto T tem t elementos, e o
n umero de elementos de U submetido ao tratamento T
i
e n
i
, com i = 1, 2, . . . , t, de tal
modo que

t
i=1
n
i
= n. O n umero de unidades experimentais n
i
para cada tratamento T
i
e determinado a partir de informacoes sobre a variabilidade das unidades experimentais
Peres, Tavares & Madruga
1.6 Aleatorizacao 5
em termos da variavel dependente, custo e poder dos testes de signicancia (Neter, 1974
pg. 492).
PLANO EXPERIMENTAL COMPLETAMENTE ALEATORIZADO
Em um esquema completamente aleatorizado as unidades experimentais que vao ser
submetidas a cada tratamento sao escolhidas completamente ao acaso. Isto signica que
cada unidade experimental tem igual probabilidade de receber qualquer um dos tratamen-
tos, nao existindo restricao alguma no criterio de aleatorizacao.
EXEMPLO - Um pesquisador quer realizar um experimento para estudar o efeito de
um resduo industrial que e adicionado racoes de animais. Ele suspeita que este resduo
contem uma substancia toxica, cuja presenca no organismo produz um aumento relativo
de alguns orgaos, como o fgado por exemplo.
Apos uma entrevista com o pesquisador conseguimos as informacoes:
a) o experimento ira envolver um unico fator, racao, com tres nveis: racao normal, sem
o resduo industrial (grupo controle), racao normal com o resduo tratado, isto e, o
resduo passa por um tratamento para eliminar a substancia toxica e racao normal
com o resduo nao tratado. Portanto o conjunto T tem tres tratamentos (t=3).
b) Um conjunto U e formado por um grupo de 18 camundongos, todos recem-nascidos,
com o mesmo peso inicial e homogeneos em relacao a caractersticas geneticas ge-
rais. Por isto foi decidido distribuir completamente ao acaso 6 animais para cada
tratamento.
c) A variavel dependente e o peso relativo do fgado apos 90 dias do incio do experi-
mento.
Uma maneira de se proceder o sorteio e a seguinte:
enumera-se as unidades experimentais de 1 a 18.
coloca-se os tratamentos em seq uencia, por exemplo:
T
1
T
1
T
1
T
1
T
1
T
1
, T
2
T
2
T
2
T
2
T
2
T
2
, T
3
T
3
T
3
T
3
T
3
T
3
.
sorteia-se uma seq uencia de 18 n umeros dentre os n umeros de 1 a 18 em tabua de
n umeros aleatorios. Pode-se obter, por exemplo, a seq uencia: 3, 1, 11, 15, 18, 16, 4, 5, 9,
12, 8, 7, 14, 2, 6, 13, 10.
Finalmente, o plano experimental e esquematizado conforme apresentamos na Tabela
1.1.
Este plano experimental e mais eciente quanto maior for o grau de homogeneidade
entre unidades experimentais em termos da variavel dependente. Se as unidades experi-
mentais sao heterogeneas, o n umero n de unidades experimentais necessario para uma
Peres, Tavares & Madruga
6 Introducao
Tabela 1.1 - Distribuicao das unidades experimentais
segundo os tratamentos
T
1
T
2
T
3
U
3
U
4
U
17
U
1
U
5
U
14
U
11
U
9
U
2
U
15
U
12
U
6
U
18
U
8
U
13
U
16
U
7
U
10
boa precisao pode ser muito grande. Quando este for o caso devemos procurar outros pla-
nos experimentais que reduzam o erro experimental. Algumas alteracoes no planejamento
descrito, tais como a introducao de blocos, ou simplesmente a utilizacao de uma variavel
auxiliar (covariada) medida nas unidades experimentais, a qual e correlacionada com a
variavel dependente, podem reduzir consideravelmente o erro experimental.
OBSERVAC

AO 1 - A descricao de um plano experimental completamente aleatorizado
apresentada acima nao depende do n umero de fatores envolvidos e nem da maneira pela
qual os fatores sao combinados, isto e, se eles obedecem a uma classicacao cruzada ou
hierarquica (veja Captulo 3). Assim, se um experimento envolve 3 fatores, um deles com
dois nveis, um outro com tres nveis e o terceiro com tres nveis, o n umero de tratamentos
sera 18 (2 3 3) e a associacao entre os conjuntos U e T se faz da mesma maneira.
OBSERVAC

AO 2 - Existem alguns fatores, que pela sua propria natureza, impoe res-
tricoes na aleatorizacao; porem, para efeito de analise, o experimento e considerado com-
pletamente aleatorizado. Suponha que um grupo de 30 alunos da segunda serie do segundo
grau, sorteados entre todos os alunos do sistema escolar de Sao Paulo, sendo 15 do sexo
masculino e 15 do sexo feminino, sao submetidos a um determinado metodo de ensino
durante um perodo de tempo. O objetivo do experimento e comparar, quanto ao sexo,
o desempenho dos alunos em um teste aplicado apos o perodo de aprendizado. Assim,
a unidade experimental e o aluno da segunda serie do segundo grau, o fator e sexo com
dois nveis e a variavel dependente e a nota obtida no teste. Neste caso. As unidades expe-
rimentais nao podem ser distribudas completamente ao acaso entre os dois tratamentos
(sexo masculino e sexo feminino), pois a natureza do fator impoe uma restricao natural na
aleatorizacao. Quando isto acontece dizemos que o fator e de classicac ao. Caso contrario
dizemos que o fator e experimental. Para ns de analise este experimento e equivalente ao
experimento completamente aleatorizado, porque, nas duas situacoes as observa coes cons-
tituem um conjunto de amostras aleatorias independentes, sendo cada uma identicada
por uma combinacao dos nveis dos fatores, sejam eles experimentais ou de classicacao.
Peres, Tavares & Madruga
1.7 Repeticao 7
PLANO EXPERIMENTAL EM BLOCOS
Quando o conjunto U de unidades experimentais for muito heterogeneo (em termos da
variavel independente), o plano experimental completamente aleatorizado torna-se muito
grande. Em algumas situacoes dispomos de informacoes segundo as quais, antes da rea-
lizacao do experimento, e possvel agruparmos as unidades experimentais em subconjuntos
de t unidades experimentais mais ou menos homogeneas, onde t e o n umero de tratamentos
envolvidos no experimento.
Estes subconjuntos sao denominados blocos. Assim, a maior parte da heterogeneidade
interna do conjunto U e expressa pela heterogeneidade entre os blocos. A distribuicao das
unidades experimentais entre os tratamentos obedece a uma restricao imposto pelos blocos,
isto e, as t unidades de cada bloco sao distribudas aleatoriamente entre os tratamentos.
Na analise de um experimento em blocos, alem dos fatores de interesse, deve-se levar
em conta o fator de controle experimental, blocos, diminudo desta maneira o erro experi-
mental. Quanto maior for a heterogeneidade entre blocos, maior e a eciencia deste plano
experimental em relacao ao completamente aleatorizado.
EXEMPLO - Um educador quer realizar um experimento com alunos da segunda serie
do primeiro grau, para comparar tres metodos de ensino. As unidades experimentais sao
os alunos e suponha que eles formem um conjunto de bastante heterogeneo com relacao
ao Q.I. Portanto uma maneira de controlar esta heterogeneidade e agrupar os alunos em
subconjuntos de tres alunos de acordo com as faixas de Q.I. Suponha que o experimento
vai ser realizado com 30 alunos, entao, o nosso conjunto U sera formado por 10 blocos,
cada um com 3 unidades experimentais, que serao submetidas aleatoriamente, uma a cada
metodo de ensino. Para ns de analise, este experimento tera dois fatores, metodos de
ensino com tres nveis, e blocos com 10 nveis.
1.7 Repeticao
Para que possamos entender o que signica repetir um experimento, consideremos um
experimento com um fator com tres nveis (tres tratamentos). Um conjunto de 3 unidades
experimentais distribudos aleatoriamente, uma para cada tratamento, constituem uma
repeticao do experimento. Mais tres unidades distribudas aleatoriamente aos tratamen-
tos constituem uma seguida repeticao, etc. Para 4 repeticoes as observacoes podem ser
colocadas na seguinte tabela:
Este experimento poderia tambem ser realizado distribuindo-se aleatoriamente 4
unidades experimentais para cada tratamento. No primeiro plano experimental diremos
que o experimento completo foi repetido quatro vezes, e no segundo diremos que cada
tratamento foi repetido quatro vezes. Em geral as proprias condicoes de realizacao do
experimento determinam quais dos dois planos deve ser utilizado. Estes dois processos
sao completamente equivalentes desde que, no caso de repeticoes completas, cada unidade
experimental do conjunto U tenha a mesma probabilidade de pertencer a cada replica e
as replicas sejam executadas exatamente nas mesmas condicoes experimentais.
Peres, Tavares & Madruga
8 Introducao
Tratamentos
T
1
T
2
T
3
y
11
y
21
y
31
y
12
y
22
y
32
y
13
y
23
y
33
y
14
y
24
y
34
1.8 Analise estatstica dos resultados
Vimos no incio deste captulo que o objetivo da analise estatstica e vericar as
hipoteses formuladas no incio da pesquisa cientca. Dentro da terminologia denida no
decorrer deste captulo, estas hipoteses vao sempre ser expressas em termos da relacao en-
tre a variavel dependente e os fatores envolvidos. Este assunto sera tratado nos captulos
subseq uentes.
Peres, Tavares & Madruga
Captulo 2
Experimentos com um fator
2.1 Introducao
Neste captulo apresentamos a analise de experimentos completamente casualizados
com um fator. Contudo, na analise de experimentos com um fator e importante considerar-
mos se esse fator e xo ou aleatorio. Na Secao 2.2 apresentamos a analise de experimentos
com um fator xo e na Secao 2.3 a analise de experimentos com um fator aleatorio. Antes
disso vamos apresentar alguma notacao comum a ambos os casos.
Seja k o n umero de nveis desse fator. A notacao que vamos adotar para representar as
observacoes obtidas no experimento e dada na Tabela 2.1
Tabela 2.1 - Observacoes referentes a um experimento
com um fator com k nveis
Tratamento Total
1 2 k
y
11
y
21
y
k1
.
.
.
.
.
.
.
.
.
y
1n
1
y
2n
2
y
kn
k
media amostral y
1.
y
2.
y
k.
y
..
variancia amostral S
2
1.
S
2
2.
S
2
k.
S
2
..
tamanho da amostra n
1
n
2
n
k
n
onde,
y
ij
e a j-esima observa cao correspondente ao i-esimo tratamento
n
i
e o n umero de unidades experimentais submetidas ao i-esimo tratamento
n =

n
i=1
n
i
e o n umero total de unidades experimentais.
10 Experimentos com um fator
As medias amostrais por tratamento e geral sao dadas, respectivamente, por
y
i.
=
1
n
i
n
i

j=1
y
ij
; y
..
=
1
n
k

i=1
n
i

j=1
y
ij
.
e as variancias amostrais por
S
2
i.
=
1
n
i
1
n
i

j=1
(y
ij
y
i.
)
2
; S
2
..
=
1
n 1
k

i=1
n
i

j=1
(y
ij
y
..
)
2
.
Tambem e frequente considerarmos a variancia combinada (ou pooled), denida por
S
2
p
=
1
n k
k

i=1
n
i

j=1
(y
ij
y
i.
)
2
.
2.2 Experimentos com um fator xo
Em experimentos completamente casualizados com um fator xo, temos interesse em
vericar a inuencia dos k nveis desse fator em uma variavel dependente y em estudo. Uma
forma de vericarmos a existencia dessa inuencia e comparar as medias populacionais da
variavel y sob efeito dos k tratamentos.
No decorrer desta secao, apresentarmos um teste de igualdade dessas k medias bem
como as suposicoes necessarias para executarmos tal teste.
2.2.1 Modelo matematico
O modelo matematico associado a experimentos com um fator xo e
y
ij
= +T
i
+e
ij
, (2.1)
ou
y
ij
=
i
+e
ij
, (2.2)
onde e a media comum a todas as observa coes, denidas como
=
1
n
k

i=1
n
i

i
, (2.3)
sendo
i
a media populacional de Y no i-esimo tratamento,
T
i
e o efeito no i-esimo nvel do fator na variavel dependente e mede o afastamento
da media
i
em relacao a , isto e:
Peres, Tavares & Madruga
2.2 Experimentos com um fator xo 11
T
i
=
i
,
e
ij
e um erro casual nao observavel.
Pelas denicoes de e T
i
acima, temos que o modelo (2.1) possui a restricao
k

i=1
n
i
T
i
= 0,
pois,
k

i=1
n
i
T
i
=
k

i=1
n
i
(
i
) =
k

i=1
n
i

i
n = 0,
onde a ultima igualdade segue de (2.3).
2.2.2 Suposicoes associadas ao modelo
As suposicoes associadas aos componentes do modelo (2.1) sao que os erros e
ij
sao
variaveis aleatorias normalmente distribudas, com media zero e mesma variancia em todos
os tratamentos, e que sao independentes. Essas suposicoes normalmente sao representadas
por: e
ij
N(0,
2
), indep.
Como y
ij
sao funcoes lineares de e
ij
, das suposicoes sobre os erros decorre que:
a) E(y
ij
) = +T
i
=
i
b) V ar(y
ij
) =
2
c) y
ij
sao normalmente distribudos e independentes.
Resumidamente, vamos escrever
y
ij
N(
i
,
2
), indepenedentes.
2.2.3 Hipoteses
A hipotese geral e
H
0
: T
1
= . . . = T
k
= 0, (2.4)
ou seja, vamos testar a nao existencia de efeito do fator.
Peres, Tavares & Madruga
12 Experimentos com um fator
Figura 2.1 Ilustracao das suposicoes do modelo matematico associado a um experimento com um
fator xo
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
-3 -2 -1 0 1 2 3 4 5 6 7 8 9 10
2.2.4 Particao da soma de quadrados total e graus de liberdade
Consideremos a identidade
y
ij
y
..
= (y
ij
y
i.
) + (y
i.
y
..
) (2.5)
O termo
y
ij
y
..
mede o desvio de uma observacao em relacao `a media amostral geral, sem levar em conta
a que tratamento pertence essa observacao. Observemos que esse desvio e a soma de duas
componentes: (y
ij
y
i.
), que e a medida do desvio da observacao em relacao `a media do
seu grupo, e (y
i.
y
..
), que e uma medida do afastamento da media do i-esimo tratamento
em relacao `a media geral.
Elevando ao quadrado os dois membros da identidade (3.2) e somando em relacao aos
ndices i e j, e notando que os duplos produtos sao nulos, obtemos:
k

i=1
n
i

j=1
(y
ij
y
..
)
2
=
k

i=1
n
i

j=1
(y
ij
y
i.
)
2
+
k

i=1
n
i
(y
i.
y
..
)
2
A soma dos quadrados:
Peres, Tavares & Madruga
2.2 Experimentos com um fator xo 13
k

i=1
n
i

j=1
(y
ij
y
..
)
2
e denominada soma dos quadrados total e vamos denota-la por SQT. Este termo e uma
medida da variabilidade total das observacoes em relacao `a media geral. O n umero de
graus de liberdade associado a SQT e n 1, pois temos n observa coes e a restricao
k

i=1
n
i

j=1
(y
ij
y
..
) = 0.
A parcela:
k

i=1
n
i

j=1
(y
ij
y
i.
)
2
e deniminado soma de quadrados residual (SQR), e e uma medida da homogeneidade
interna dos tratamentos. Quanto mais proximas estiverem as observacoes dentro de cada
grupo, menor e a SQR. Notemos que a magnitude da SQR nao depende da diferenca entre
as medias dos tratamentos. Considerando apenas o i-esimo tratamento, teremos que
n
i

j=1
(y
ij
y
i.
)
2
possui n
i
1 graus de liberadade. Assim, o n umero de graus de liberadade associado a
SQR e
k

i=1
(n
i
1) = n k.
A segunda componente de SQT:
k

i=1
n
i
(y
i.
y
..
)
2
mede a variabilidade entre as medias dos tratamentos e por isso e denominada soma de
quadrados entre tratamentos (SQE). Quanto mais diferente entre si forem essas medias,
maior sera a SQE. Desde que temos k tratamentos e a restricao de que
k

i=1
n
i
(y
i.
y
..
) = 0
SQE possui k 1 graus de liberdade. Adotando a notacao que acabamos de introduzir,
podemos escrever que
Peres, Tavares & Madruga
14 Experimentos com um fator
SQT = SQR +SQE.
2.2.5 Quadrados medios
Dividindo SQR e SQE pelos correspondentes graus de liberdade, obtemos, respectiva-
mente o quadrado medio residual (QMR) e o quadrado medio entre tratamentos (QME),
isto e,
QMR =
SQR
n k
e QME =
SQE
k 1
Obs: As SQ podem ser escritas tambem como
SQT =
k

i=1
n
i

j=1
y
2
ij
ny
2
..
=
k

i=1
n
i

j=1
y
2
ij

Y
2
..
n
SQE =
k

i=1
y
2
i.
ny
2
..
=
k

i=1
Y
2
i.
n
i

Y
2
..
n
SQR = SQT SQE
2.2.6 Esperancas dos quadrados medios (EQM)
Mostramos Apendice A que:
E(QME) =
2
+
1
k 1
k

i=1
n
i
T
2
i
e E(QMR) =
2
Assim, temos que QME e um estimador nao viesado da variancia
2
, se a hipotese dada
pela relacao (2.2) for verdadeira, e o QMR e sempre um estimador nao viesado de
2
.
2.2.7 Estatstica e regiao crtica do teste
A estatstica para o teste e
F
0
=
QME
QMR
As expressoes das EQM nos indicam que o valor observado de F
0
deve ser proximo de
1 se H
0
ja verdadeira, enquanto que valores grandes dessa estatstica sao uma indicacao
de que H
0
e falsa.
Pelo Teorema de Cochran (Neter, 1974, pag.92), temos que:
(i)
SQE

2
tem distribuicao
2
com (k 1) graus de liberdade, sob H
0
:
Peres, Tavares & Madruga
2.2 Experimentos com um fator xo 15
(ii)
SQR

2
tem distribuicao
2
com (n k) graus de liberdade;
(iii)
SQE

2
e
SQR

2
sao independentes.
Portanto, a estatstica F
0
tem, sob H
0
, distribuicao F-Snedecor com (k 1) e (n k)
graus de liberdade. Resumidamente, indicamos:
F
0
F
k1,nk
, sob H
0
.
rejeitamos H
0
ao nvel de signicancia se
F
0
> F
k1,nk,.
onde F
k1,nk,
e quantil de ordem (1) da distribucao F-Snedecor com (k1) e (nk)
graus de liberdade, ou, de forma equivalente, se o p-value associado for menor que .
2.2.8 Quadro da analise de variancia (ANOVA)
Dispomos as expressoes necessarias ao teste de H
0
na Tabela 2.2 denominada Quadro
de Analise de Variancia (ANOVA).
Tabela 2.2 - ANOVA em experimentos com um fator
fonte de variacao g.l SQ QM EQM F
0
entre tratamentos k-1 SQE QME
2
+
1
k1

k
i=1
n
i
T
2
i
QME
QMR
resduo (dentro dos tratamentos) n-k SQR QMR
2
total n-1 SQT
2
2.2.9 Exemplo
Em uma fase de um experimento efetuado para se estudar diabetes gestacional, desejava-
se avaliar o comportamento da hemoglobina glicolisada (HbA) em gestantes normais (N),
gestantes com tolerancia diminuida (TD) e gestantes diabeticas (D). Para isto foram es-
colhidas aleatoriamente 10 gestantes de cada tipo e mediu-se suas HbA. Na Tabela 2.3
apresentamos os dados obtidos nesse experimento.
Neste experimento temos um fator, Tipo de Gestante, com tres nveis: N, TD e D. Nosso
objetivo e vericar se as HbA medias dos tres grupos de gestantes sao iguais.
SQT =
SQE =
SQR = SQT SQE =
Peres, Tavares & Madruga
16 Experimentos com um fator
Tabela 2.3 - Hemoglobina glicosilada (HbA) em gestantes normais (N),
com tolerancia Diminuda (TD) e Diabeticas (D)
tratamento
N TD D
7,86 6,20 9,67
6,38 7,82 8,08
6,90 8,50 9,25
7,78 6,50 8,20
8,17 8,09 8,64
6,26 6,90 9,67
6,30 7,82 9,23
7,86 7,45 10,43
7,42 7,75 9,97
8,63 7,43 9,59
media amostral 7,36 7,45 9,27 8,03
tamanho da amostra 10 10 10 30
Tabela 2.4 - ANOVA do estudo da HbA em gestantes
F.V. g.l SQ QM F
0
p-value
entre grupos 2 23,403 11,702 19,36 0,000
resduo 27 16,316 0,604
total 29 39,719
Na Tabela 2.4 construmos a ANOVA correspondente a este experimento. Pelo valor
de F
0
observado conclumos, ao nvel de signicancia = 0, 05, que as HbA medias dos
tres tipos de gestantes nao sao iguais. A mesma consclusao poderia ser obtida olhando-se
para o p-value; caso este valor seja inferior ao nvel de signicancia pre-estabelecido ()
rejeitamos a hipotese em teste.
2.2.10 Estimacao das medias dos tratamentos
Os estimadores de mnimos quadrados dos parametros do modelo (2.1) sao obtidos
minimizando-se a soma dos quadrados dos resduos:
Peres, Tavares & Madruga
2.2 Experimentos com um fator xo 17
k

i=1
n
i

j=1
(y
ij
T
i
)
2
em relacao a e T
i
, i = 1, . . . , k, sujeito `a restricao:
k

i=1
n
i
T
i
= 0.
Assim procedendo, obtemos que os estimadores de e T
i
sao respectivamente, dados
por:
= y.. e

T
i
= y
i.
y
..
O estimador de mnimos quadrados de
i
e:

i
=

T
i
= y
i.
, i = 1, . . . , k.
Para construrmos um intervalo de conanca para a media de cada tratamento, devemos
notar que das siposicoes sobre a distribuicao dos erros decorre que:
y
i.
N
_

i
,

2
n
i
_
,
Vimos que o quadrado medio residual (QMR) e um estimador nao viesado de
2
e
que
SQR

2
tem distribuicao
2
com (n k) graus de liberdade. Pode-se tambem mostrar
que SQR/
2
e independente de y
1.
, . . . , y
k
. Portanto,
y
i.

i
_
QMR
n
i
tem distribuicao t-student com (nk) graus de liberdade. Um intervalo de conanca para

i
com coeciente conanca = 1 e, entao, dado por
_
y
i.
t
c
_
QMR
n
i
; y
i.
+t
c
_
QMR
n
i
_
.
onde t
c
e o quantil de ordem 1

2
da distribuicao t-student com (n-k) graus de liberdade.
2.2.11 Exemplo
Considerando o exemplo dado em 2.2.10. apresentamos na Tabela 2.5 as extimativas
por ponto e por intervalo das HbA medias em cada grupo de gestante.
Peres, Tavares & Madruga
18 Experimentos com um fator
Tabela 2.5 - Estimativas por ponto e por intervalo das HbA medias
de gestantes N, TD e D (dados na Tabela 2.3)
N TD D

i
7,36 7,453 9,27
IC(,
i
, = 0, 95) [6,85;7,87] [6,94;7,95] [8,76;9,78]
2.2.12 Comparacoes m ultiplas
Se pela ANOVA constatarmos que existe efeito do fator em estudo, e interessante
prosseguir a analise a m de localizarmos as diferencas entre as medias nos diferentes
tratamentos. A continuidade da analise e feita de tecnicas estatsticas denominadas com-
paracoes mltiplas que permitem testar hipoteses do tipo:
H
0
: C = 0 versus H
1
: C = 0
onde
C =
k

i=1
c
i

i
, (2.6)
com a restricao de que
k

i=1
c
i
= 0.
A funcao C denida acima e denominada contraste. Nesta secao vamos apresentar
quatro metodos de comparacoes m ultiplas e estabelecer as situacoes nas quais um desses
metodos e mais adequado que os demais. Antes disso, porem, vamos considerar o problema
de estimacao por intervalo de um contraste.
Um estimador nao viesado de um contraste C e:

C =
k

i=1
c
i
y
i.
(2.7)
A variancia desse estimador e dada por:
V ar(

C) = V ar
k

i=1
c
i
y
i.
=
k

i=1
c
2
i
V ar y
i.
=
2
k

i=1
c
2
i
n
i
.
Peres, Tavares & Madruga
2.2 Experimentos com um fator xo 19
Como QMR e um estimador nao viesado de
2
, a estatstica:

V ar(

C) = QMR
k

i=1
c
2
i
n
i
(2.8)
e um estimador nao viesado de V ar(

C). Para obtermos um intervalo de conanca para
C, devemos lembrar que

C e uma combinacao linear da variaveis aleatorias independentes
e normalmente distribuidas e tem, portanto, distribuicao normal. Alem disso,
SQR

2
tem
distribuicao
2
com (n k) graus de liberdade e e independente de y
i.
, . . . , y
k.
. Assim, a
estatstica:

C C
_
QMR

k
i=1
c
2
i
n
i
tem distribuicao t-student com (nk) graus de liberdade e um intervalo de conanca para
um particular contraste C com coeciente de conanca = 1 e dado por:
_
_
C t
c

_
QMR
k

i=1
c
2
i
n
i
;

C +t
c

_
QMR
k

i=1
c
2
i
n
i
_
_
(2.9)
onde t
c
e o quantil de ordem 1

2
da distribuicao t-stundent com (n k) graus de
liberdade.
2.2.13.b Exemplo
Consideremos o estudo da HbA em gestantes normais, com tolerancia diminuda
e diabeticas. Conclumos, atraves de uma analise de variancia, que a HbA media nos
tres grupos de gestantes nao e a mesma. Suponhammos que o pesquisador ja estivesse
particularmente interessado, antes de realizar o experimento, na comparacao das HbA
medias de gestantes com tolerancia diminuda com as diabeticas.
Neste caso,
C =
2

3
onde
2
e a HbA media na populacao de gestantes com tolerancia dininuda, e
3
e a HbA
media na populacao de gestantes diabeticas.
Pela relacao (2.4), temos que:

C = 7, 45 9, 27 = 1, 82.
Por (2.6) um intervalo de conanca para C com = 0, 95 e dado por:
Peres, Tavares & Madruga
20 Experimentos com um fator
_
1, 82 2, 05

0, 611
_
1
10
+
1
10
_
; 1, 82 + 2, 05

0, 611
_
1
10
+
1
10
_
_
=
= [2, 54 ; 1, 10].
Como o ponto zero nao pertence a esse intervalo, conclumos, ao nvel de signicancia
= 0, 05, que as HbA medias das gestantes com tolerancia diminuda e das diabeticas sao
diferentes.
2.2.13.c Metodo de contrastes ortogonais
Dizemos que dois contrastes:
C
1
=
k

i=1
c
i1

i
e C
2
=
k

i=1
c
i2

i
sao ortogonais se:
k

i=1
c
i1
c
i2
n
i
= 0
O metodo de contraste ortogonais consiste em particionar a SQE em (k 1) parcelas,
cada uma com 1 grau de liberdade, correspondentes a contrastes ortogonais. Essas parcelas
sao dadas por:
SQ(C
j
) =

C
2
j

k
i=1
C
2
ij
n
i
(2.10)
onde

C
j
=
k

i=1
c
ij
y
i.
.
Estamos interessados em testar as hipoteses:
H
0j
: C
j
= 0 vs H
1j
: C
j
= 0. (2.11)
A estatstica:
SQ(C
j
)

2
Peres, Tavares & Madruga
2.2 Experimentos com um fator xo 21
tem, sob H
0j
, distribuicao de
2
com 1 grau de liberdade e e independente de SQR. Ja
vimos que SQR/
2
tem distribucao de
2
com (n k) graus de liberdade. Portanto as
estatsticas:
F
j
=
SQ(C
j
)
QMR
(2.12)
tem, sob H
0j
, distribuicao F-snedecor com 1 e (nk) graus de liberdade e serao utilizadas
para testar as hipoteses (2.8).
O metodo de contrastes ortogonais possui as seguintes restricoes:
i) So podemos testar um conjunto de (k 1) contrastes ortogonais que nem sempre
fornece ao pesquisador a informacao de interesse a cerca do tipo de diferenca existente
entre as medias;
ii) Para garantirmos o nvel de signicancia em cada teste, os contrastes a serem testados
devem ser escolhidos antes da realizacao do experimento (Neter, 1974, pagina 472).
Quando o fator em estudo e quantitativo, e possvel vericarmos qual o grau do po-
linomio que relaciona a variavel dependente com os nveis do fator, utilizando a tecnica
de contrastes ortogonais. Ilustramos esta armacao no exemplo dado em 2.2.13.d.
2.2.13.d Exemplo
Um mesmo tipo de condutor eletrico tem sido usado em linhas de transmissao que
possuem as mesmas caractersticas, variando unicamente a altitude da regiao por onde
essas linhas passam. O tempo de vida ativa desse condutor tem apresentado variacoes que
levaram o fabricante a suspeitar que a pressao atmofesrica (e portanto a altitude) exerce
inuencia no seu tempo de vida. Realizou-se um experimento com o objetivo de testar
essa hipotese e de se avaliar o tipo relacao existente entre altitude e tempo de vida. Doze
condutores recem-sados da fabrica foram divididos aleatoriamente em 3 grupos com 4
condutores cada um, e utilizados nas linhas de transmissao em 3 altitudes especcas que
sao de grande interesse do ponto de vista tecnico: 0m; 500m; 1.000m.
Apresentamos abaixo as medias amostrais e o quadro de analise de variancia construdo
com os resutados obtidos neste esperimento:
y
1.
= 2, 58 (0m) n
1
= 4
y
2.
= 4, 10 (500m) n
2
= 4
y
3.
= 6, 13 (1.000m) n
3
= 4
Como F
2;9;0.01
= 8, 02, rejeitamos a hipoteses a hipotese de que nao existe efeito de altitude.
Vamos proseguir a analise com o objetivo de avaliar o grau do polinomio que relaciona
tempo de vida e altitude. Isto e feito construindo contrastes que permitem vericar a
Peres, Tavares & Madruga
22 Experimentos com um fator
F.V. g.l SQ QM F
entre tratamentos 2 25, 38 12, 69 23, 07
resduo 9 4, 99 0,55
total 11 30,37
existencia de efeitos linear, quadratico, c ubico, etc. nesta ordem. Como o n umero maximo
de contrastes e k 1, no nosso exemplo podemos apenas testar a existencia de efeitos
linear e quadratico. Com esta nalidade, consideremos os contrastes:
C
1
=
1

3
e
C
2
=

1
+
3
2

2
Esses constrastes sao ortogonais pois:
3

i=1
c
i1
c
i2
= 0.
Vamos testar as hipoteses:
H
01
: C
1
= 0 vs H
11
: C
1
= 0 (2.13)
e
H
0
2
: C
2
= 0 vs H
1
2
: C
2
= 0 (2.14)
utilizando a estatstica dada pela relacao (2.9). Por (2.7) temos que
SQ(C
1
) =
(2, 58 6, 13)
2
1/4 + 1/4
= 25, 21
SQ(C
2
) =
[(2, 58 + 6, 13)/2 4, 10]
2
1/16 + 1/16 + 1/4
= 0, 17
Reescrevemos abaixo o quadro de analise de variancia deste experimento, indicando a
particao da SQE e os valores da estatstica F
j
dada pela relacao (2.9).
Como F
1;9;0,01
= 6, 63, rejeitamos a hipotese de que C
1
= 0 e nao rejeitamos a hipotese
de que C
2
= 0. Em outras palavras, existente efeito linear e nao existe quadratico da
altitude no tempo de vida medio dos condutores. Assim, a relacao entre altitude e tempo
de vida e do tipo:
Peres, Tavares & Madruga
2.2 Experimentos com um fator xo 23
ANOVA
F.V. g.l SQ QM F
C
1
1 25,21 25,21 45,84
C
2
1 0,17 0,17 0,31
entre tratamentos 2 25,38 12,69 23,07
resduo 9 4, 99 0,55
total 11 30,37
Y = + X + ,
onde:
Y e o tempo de vida
X e a altitude
e sao os paramentros desconhecidos, e
e um erro casual.
Existem varias propostas de testes para identicacao das diferencas, tais como Tukey,
Schee, Bonferrony, Duncan, Dunnett, Sidak, dentre outros. Abaixo, apresentamos os tres
primeiros para ilustracao.
2.2.13.e Metodo de Tukey para o conjunto de todas as diferencas
entre medias de dois tratamentos
Este metodo de comparacoes m ultiplas permite construir intervalos de conanca para
todos os
_
k
2
_
=
k(k1)
2
contrastes do tipo
C
ij
=
i

j
, i = j,
xando-se um coeceiente de conanca = 1 para toda a famlia de intervalos.
Podemos entao comparar as medias dos tratamentos duas a duas, garantindo que o nvel
de signicancia conjunto de todos os testes e igual a .
Para experimentos balanceados com r observa coes em cada tratamento, o intervalo de
conanca para C
ij
e
_
(y
i.
y
j.
) q

_
QMR
r
; (y
i.
y
j.
) +q

_
QMR
r
_
(2.15)
Peres, Tavares & Madruga
24 Experimentos com um fator
onde q

e o quantil de ordem
_
1

2
_
da distribuicao da estatstica:
q(k, v) =
max(y
i.

i
) min(y
i.

i.
)
_
QMR
r
Essa distribuicao e denominada studentized rangecom parametros k e v que, em nosso
caso, sao iguais ao n umero de tratamentos e o n umero de graus de liberdade do resduo,
respectivamente, e esta tabulada, dentre outros, em Neter (1974, pag. 824-825).
Se o experimento for nao balanceado, os limites de conanca para C
ij
sao obtidos de
forma aproximada e sao dados por:
_
(y
i.
y
j.
)
q

QMR
_
1
n
i
+
1
n
j
_
; (y
i.
y
j.
) +
q

QMR
_
1
n
i
+
1
n
j
_
_
(2.16)
2.2.13.f Metodo de Schee para o conjunto de todos os contrastes
O metodo de Schee fornece intervalos de conanca para todos os contrastes
C =
k

i=1
c
i

i
,
k

i=1
c
i
= 0.
Estes intervalos sao dados por
[

C S
_

V ar(

C);

C +S
_

V ar(

C)] (2.17)
onde
S
2
= (k 1)F
c
,
F
c
e o quantil de ordem (1 ) da distribucao F-Snedecor com (k 1) e (n k) graus
de liberdade;

C e

V ar(

C) sao dados, respectivamente, pelas relacoes (2.4) e (2.5). O
coeciente de conanca conjunto de todos os possveis intervalos e = 1 . Assim, se
utilizarmos esses intervalos para testar hipoteses do tipo:
H
0
: C = 0,
o nvel de signicancia conjunto de todos esses testes igual a . Observemos que o metodo
de Schee e exato mesmo para experimentos nao balanceados, ao contrario do metodo de
Tukey.
Peres, Tavares & Madruga
2.2 Experimentos com um fator xo 25
2.2.13.g Metodo de Bonferroni
Este metodo de comparacao m ultipla pode ser utilizado para experimentos nao ba-
lanceados e e adequado quando estamos interessados em um n umero xado de contrastes
p. O intervalo de conanca para um contraste C
j
e dado por
_

C
j
B
_

V ar

C
j
;

C
j
+B
_

V ar

C
j
_
= 1, . . . , p (2.18)
onde
B e o quantil de ordem
_
1

2p
_
da distribuicao t-Student com (nk) graus de liberdade;

C
j
e

V ar

C
j
sao dados, respectivamente, pelas relacoes (2.4) e (2.5).
O metodo de Bonferroni garante que a probabilidade de que os p intervalos estejam
simultaneamente corretos e maior ou igual a = 1 .
2.2.13.h Comparacoes entre os metodos de comparacoes m ultiplas
Sempre que os contrastes de interesse forem escolhidos antes da realizacao do expe-
rimento e pertencerema um mesmo conjunto de (k 1) contrastes ortogonais, devemos
adotar a tecnica de contraste ortogonais para detectarmos as possveis diferencas entre
as medias dos tratamentos. O motivo dessa escolha e que os intervalos de conanca ob-
tidos por esta tecnica tem amplitude menor que os fornecidos pelos outros metodos de
comparacoes m ultiplas apresentados nesta secao.
Se os contrastes a serem estimados forem escolhidos a priori mas nao forem ortogonais
entre si, a tecnica de comparacoes m ultipla a ser adotada deve ser escolhida entre os
metodos de Turkey, Schee ou Bonferroni. Para decidirmos qual a tecnica a ser aplicada,
devemos procurrar aquela que fornece intervalos de conanca de menor amplitude para os
contrastes de interesse. Observando os intervalos (2.12), (2.13) e (2.14), podemos concluir
que:
a) O metodo de Turkey deve ser adotado quando tivermos interesse em todas as possveis
comparacoes de medias dos tratamentos duas a duas. Quando o m umero de com-
paracao for pequeno em relacao a k(k 1)/2, o metodo de Bonferroni e mais preciso
que o de Turkey.
b) O metodo de Schee deve ser adotado quando temos interesse em varios contrastes,
com pelo menos um deles envolvendo mais de duas medias. Se o n umero de contrastes
a serem estimados for pequeno, o metodo de Bonferrone e prefervel ao metodo de
Schee.
Peres, Tavares & Madruga
26 Experimentos com um fator
Se os contrastes de interessse forem determinados apos a realizacao do experimento,
devemos escolher entre os metodos de Turkey ou Schee. Pelas relacoes (2.12) e (2.13),
conclumos que:
a) Se todos os contrastes a serem estimados envolverem apenas duas medias, o metodo
de Turkey fornece intervalos de menor amplitude que os de Schee e deve, neste
caso, ser adotado.
b) Se pelo menos um contraste envolver mais de duas medias o metodo de Schee deve
ser o escolhido.
2.2.13.i Exemplo
Consideremos o estudo da HbA em gestantes normais, com tolerancia diminuda e
diabeticas. Na Secao 2.2.10 conclumos, atraves da ANOVA, que a HbA media nao e a
mesma nos tres grupos de gestante. Vamos agora comparar duas a duas as HbA medias
dos tres tratamentos, isto e, vamos considerar os contrastes:
C
1
=
1

2
, (2.19)
C
2
=
1

3
,
C
3
=
2

3
.
A Tabela 2.6 fornecemos as estimativas de C
j
, j = 1, 2, 3 e respectivamente intervalos
de conanca obtidos pelos metodos de Turkey, Schee e Bonferroni.
Tabela 2.6 - Estimativas por ponto e intervalos de conanca ( = 0, 95)
para os contrastes C
j
dados pelas relacoes (2.15)
C
j

C Intervalo de conanca
Tukey Schee Bonferroni
C
1
0,09 [-0,96;0,78] [-0,99;0,81] [-1,10;0,92]
C
2
-1,91 [-2,78;-1,04] [-2,81;-1,01] [-2,93;-0,90]
C
3
-1,82 [-2,69;-0,95] [-2,72;-0,92] [-2,84;-0,81]
Adotando qualquer um dos metodos de construcao de intervalo de conanca, a partir da
Tabela 2.6 conclumos que a media da HbA das gestantes normais e igual `a das gestantes
com tolerancia diminuda (os intervalos para C
1
contem o ponto zero) e que as gestantes
diabeticas apresentam um comportamento diferente dos outros grupos quanto `a media da
HbA. O nvel de signicancia conjunto para essas conclusoes e = 0, 05.
Observamos que os intervalos de conanca abtidos pelo metodo de Turkey tem amplitude
menor que os fornecidos pelos metodos de Schee e Bonferroni.
Peres, Tavares & Madruga
2.2 Experimentos com um fator xo 27
2.2.13 Analise de Resduos
O resduo correspondente a uma observacao y
ij
e denido como:
z
ij
= y
ij
y
ij
= y
ij
y
i.
,
ou seja, o resduo correspondente `a parte da observacao que nao foi explicada pelo mo-
delo. Calculando os resduos correspondente a todas as observacoes de um experimento e
analisando-os descritivamente de forma apropriada, podemos saber se as suposicoes estao
satisfeitas, ou seja, se o modelo adotado na analise foi adequado. Alem disso, atraves da
an alise de resduos, conseguimos detectar observacoes sujeitas e erros de medida ou de co-
dicacoes (transcricao), ou observacoes associadas `a indivduos que tem comportamento
patologico em relacao a populacao que esta sendo estudado (outliers) com o auxlio do
pesquisador que realizou o experimento, podemos corrigir as medidas sujeitas e erro, e
imcluir ou nao as observacoes referentes a indivduos com comportamento exp urio.
Relativamente `as suposicoes, precisamos vericar se (i) a dsitribuicao dos resduos e
normal; (2) se as variancias sao iguais nos k tratamentos e (iii) se os resduos sao inde-
pendentes. Estas suposicoes sao vericadas abaixo utilizando-se as sadas do Minitab e
SPSS.
Os procedimentos de analise que vamos apresentar nao se alterarem se dividirmos todos
os resduos por uma mesma constante. Por conveniencia vamos considerar os resduos
divididos por

QMR.
Para exemplicar algumas tecnicas desdritivas de analise de resduos, consideramos
os dados do experimento descritivo na Secao 2.2.10 (Estudo da HbA em gestantes). A
Tabela 2.7 fornece os valores dos resduos desse experimento divididos por

QMR obtida
a partir da ANOVA.
2.2.14.a Homocedasticidade
Na Figura 2.2 representamos gracamente os resduos correspondentes a cada grupo de
gestantes. Notamos que a variabilidade dos resduos e aproximadamente igual para os tres
grupos, o que nos indica descritivamente a suposicao da igualdade das variancias dentro
de cada tratamento. Nenhum resduo e muito maior ou menor que os demais, o que nos
garante a nao existencia de outliers.
2.2.14.b Normalidade
No Graco 2.2.13 podemos averiguar a hipotese de normalidade dos resduos. Os resduos
devem permanecer em torno de uma linha reta.
2.2.14.c Independencia Para vericarmos a validade da hipotese de independencia
dos erros, construmos na Figura 2.3 um graco dos resduos em funcao da ordem segundo
a qual as respectivas observacoes foram obtidas. Notamos que os resduos se distribuem
Peres, Tavares & Madruga
28 Experimentos com um fator
Tabela 2.5 - Resduos padronizados:
gestantes N, TD e D (dados na Tabela 2.3)
T TD D
0,64 (7) -1,60 (2) 0,51 (25)
-1,25 (12) 0,47 (15) -1,52 (29)
-0,59 (3) 1,34 (28) -0,03 (30)
0,54 (11) -1,22 (9) -1,37 (21)
1,04 (10) 0,82 (8) -0,81 (16)
-1,41 (16) -0,70 (18) 0,51 (1)
-1,36 (27) 0,47 (17) -0,05 (5)
0,64 (20) 0,00 (24) 1,48 (14)
0,08 (22) 0,38 (23) 0,89 (13)
1,62 (26) -0,03 (19) 0,41 (4)
Obs: Os n umeros entre parenteses indicam a ordem
em que as respectivas observacoes forma obtidas.
erraticamente em torno do eixo das abcissas, o que e uma indicacao da validade da inde-
pendencia.
2.3 Experimentos com um fator Aleatorio
Vimos no primeiro captulo que, quando o fator e aleatorio, apenas uma amostra dos
nveis do fator faz parte do experimento, mas as conclusoes devem ser estendidas `a toda a
populacao de nveis da qual a amostra foi retirada. Assim, a media da variavel dependente
Y associada aos nveis do fator presentes no experimento, nao sao parametros, mas sim
valores da variavel aleatoria: media da variavel Y associada a todos os possveis nveis
da populacao de nveis do fator media dos nveis. Portanto, quando realizamos um
experimento completamente casualizado com um fator aleatorio estamos interessados em
vericar a hipotese da igualdade das medias associadas `a populacao de nveis do fator, ou
seja, a hipotese de que a variavel aleatoria media dos nveise uma constante, ou ainda a
hipotese de que a variancia da variavel aleatoria media dos nveise igual a zero.
Veremos que a formulacao matematica na situac ao de fator aleatorio e diferente da
formula cao com fator xo, mas ao nal o criterio de decisao sera axatamente o mesmo.
Isso nao ocorrera se tivermos mais de um fator envolvido no experimento.
2.3.1 Modelo matematico
Vamos adotar o modelo;
Peres, Tavares & Madruga
2.3 Experimentos com um fator Aleatorio 29
Figura 2.2 Resduos para cada grupo de gestantes (dados da Tabela 2.7)
y
ij
= +T
i
+e
ij
, i = 1, . . . , k, j = 1, . . . , n
i
, (2.20)
Este modelo e analogo ao escolhido para experimentos com um fator xo. Entretanto,
pelo fato dos nveis do fator serem escolhidos aleatoriamente, as medias dos tratamentos

i
e seus efeitos T
i
sao variaveis aleatorias. A media geral e agora denida como:
= E(
i
) e T
i
=
i

2.3.2 Suposicoes do modelo
Na analise de experimentos com um fator aleatorio, vamos fazer as seguintes suposicoes
a cerca das distribuicoes das variaveis aleatorias T
i
e e
ij
:
a) e
ij
sao v.a.i.i.d. com distribuicao N(0,
2
);
b) T
i
sao v.a.i.i.d. com distribuicao N(0,
A
2
)
c) e
ij
e T
i
sao independentes.
Das suposicoes acima, decorre que:
a) E(Y
ij
) = , i , j ;
Peres, Tavares & Madruga
30 Experimentos com um fator
Figura 2.3 Normal plot
b) V ar(Y
ij
) =
2
A
+
2
c) Cov(Y
ij
, Y
ij
) = E[(Y
ij
)(Y
ij
)]
= E[(T
i
+e
ij
)(T
i
+e
ij
, )]
= E[T
2
i
+T
i
e
ij
+T
i
e
ij
+e
ij
e
ij
] = E[T
2
i
] =
2
A
e
Cov(Y
ij
, Y
i

,j
) = 0, i = i

;
d) y
ij
sao normalmente distribudos.
Na Tabela 2.8 resumimos as consequencias das suposicoes sobre a distribuicao das
variaveis aleatorias que compoem os modelos xo e aleatorio.
Notemos que, devido ao fato do fator ser aleatorio, a variancia de cada observacao tem
duas componentes:
2
e
2
A
. Assim como no modelo xo, a variancia dos erros
2
e uma
medida de variabilidade interna dos tratamentos e e constante para todos os nveis do
fator. Como estamos sorteando os nveis do fator a serem estudados, a media
i
de cada
tratamento e uma variavel aleatoria com valor esperado igual a . A componente
2
A
e uma
medida da variabilidade de
i
ao redor de , i = 1, . . . , k. Na Figura 2.4 esquematizamos
o signicado de
2
e
2
A
, considerando um fator aleatorio com dois nveis.
Cabe ainda ressaltar que as observacoes de um mesmo tratamento serao correlacionadas,
diferentemente do que ocorria no caso de fatores xos.
Peres, Tavares & Madruga
2.3 Experimentos com um fator Aleatorio 31
Figura 2.4 Resduos segundo a ordem de obtencao das observacoes no estudo da HbA em gestantes
Tabela 2.8 - Consequencias das suposicoes feitas sobre os componentes dos modelos xo
e aleatorio na distribuicao da variavel dependente
Modelo xo Modelo aleatorio
E(y
ij
)
i
= +T
i

V ar(y
ij
)
2

2
+
2
A
Cov(y
ij
, y
ij
, ) 0
2
A
j = j
Cov(y
ij
, y
i,j
) 0 0
i = i
distribuicao de y
ij
Normal Normal
2.3.3 Hipoteses
Se
2
A
=0, entao as medias de todos os possveis nveis do fator em estudo sao iguais a
. Assim, nossa hipotese de interesse e
H
0
:
2
A
= 0. (2.21)
Peres, Tavares & Madruga
32 Experimentos com um fator
2.3.4 Particao da soma dos quadrados total e graus de liberdade
A particao da soma dos quadrados total e o n umero de graus de liberdade associado
a cada fonte de variacao sao identicas ao do modelo xo.
2.3.5 Esperancas dos quadrados medios
Em um modelo aleatorio, pode-se mostrar que:
E(QME) =
2
+
1
k + 1
(n
1
n
k

i=1
n
2
i
)
2
A
E(QMR) =
2
Portanto, o QMR e um estimador nao viesado de
2
. Se a hipotese (2.17) for verdadeira,
QME tambem e um estimador nao viesado de
2
.
2.3.6 Estatstica e regiao crtica do teste
Se a hipotese (2.17) for verdadeira, devemos esperar que o valor da estatstica:
F
0
=
QME
QMR
seja proximo de 1. Pelos mesmos argumentos utilizados no caso do modelo xo, a estatstica
F
0
tem, sob H
0
, distribuicao F-snedecor com (k 1) e (n k) graus de liberdade.
A regiao crtica do teste da Hipotese (2.17) e constituda pelos valores da estatstica F
0
tais que:
F
0
> F
k1,nk,
onde F
k1,nk,
e o quantil de ordem (1 ) da distribuicao F-snedecor com (k 1) e
(n k) graus de liberdade.
2.3.7 Quadro de Analise de Variancia
Na Tabela 2.9 apresentamos o quadro de analise de variancia correspondente a um
experimento com um fator aleatorio com k nveis.
2.3.8 Exemplo
Um pesquisador esta interessado em avaliar se a temperatura media do corpo dos
animais de uma especie e constante. Como e impossvel a realizacao de um experimento
com todos os animais da especie, ele sorteou 5 animais e fez 4 medidas de suas temperaturas
de forma completamente casualizada. Apresentamos os dados obtidos na Tabela 2.10. O
quadro de analise de variancia e dado na Tabela 2.11.
Peres, Tavares & Madruga
2.3 Experimentos com um fator Aleatorio 33
Tabela 2.9 - ANOVA para experimentos com um fator aleatorio com k nveis
Fonte de variacao g.l SQ QM EQM F
0
entre tratamentos k-1 SQE QME
2
+
1
k+1
_
n
1
n

k
i=1
n
2
i
_

2
A
QME
QMR
resduo n-k SQR QMR
2
Total n-1 SQT
Tabela 2.10 - Temperatura(
o
c)em 5 animais de uma mesma especie
Animais
1 2 3 4 5 Total
26 23 25 28 30
28 20 28 27 32
25 24 24 29 28
29 22 27 31 31
Total 108 89 104 115 121 537
media 27, 00 22, 25 26, 00 28, 75 30,25 26, 85
tamanho da amostra 4 4 4 4 4 20
Neste experimento o fator de interesse e animal, cujos 5 nveis constituem uma amostra
de todos os animais da especie estudada.
Como F
4;15;0;01
= 4.89, reijeitamos a hipotese de que a temperatura media e constante
para todos os animais da especie que esta sendo estudada.
2.3.9 Estimacao em experimentos com um fator aleatorio
Nesta secao vamos considerar a estimacao por ponto e por intervalo de alguns parametros
de interesse do modelo aleatorio, nos restringindo a experimentos balanceados, isto e, va-
mos supor n
i
= n
2
= . . . = n
k
= r
Peres, Tavares & Madruga
34 Experimentos com um fator
Tabela 2.11 - ANOVA do experimento executado para o estudo
dos animais de uma especie
Fonte de variacao g.l SQ QM F p-value
entre animais 4 148,300 37,075 12,02 0,000
resduo 15 46, 250 3,083
Total 19 194,550
2.3.10 Estimacao de
Como ja vimos anteriormente, o parametro e o valor esperado das medias
i
, i =
1, . . . , k. No exemplo dado em 2.3.9, correspondente `a temperatura media de todos os
animais da especie e e um parametro de bastante interesse em nosso estudo.
Para obtermos um estimador para , devemos notar que a media amostral de todas as
observacao de um experimento pode ser escrita em termos dos parametros do modelo da
seguinte forma:
y
..
= +
1
k
k

i=1
T
i
+
1
n
k

i=1
r

j=1
e
ij
.
Considerando agora as suposicoes associadas ao modelo aleatorio, temos que:
E( y
..
) = ,
e, portanto, y
..
e um estimador nao viesado de . Utilizando os mesmos argumentos obte-
mos que a variancia do estimador y
..
e:
V ar( y
..
) =
1
k
2
k

i=1

2
A
+
1
n
2
k

i=1
n
i

j=1
=

2
+r
2
A
n
.
Como, para experimentos balanceados
E(QME) =
2
+r
2
A
,
temos que um estimador nao viesado da variavel de V ar( y
..
) e:

V ar( y
..
) =
QME
n
.
Utilizando-se os resutados acima, pode-se mostrar que estatstica:
y
..

_
QME
n
Peres, Tavares & Madruga
2.3 Experimentos com um fator Aleatorio 35
tem distribuicao t-student com (k 1) graus de liberdade e que um intervalo de conanca
para , com coeciente de conanca = 1 e dada por:
_
y
..
t
c
_
QME
n
; y
..
+t
c
_
QME
n
_
,
onde t
c
e o quantil de ordem 1

2
da distribuicao t-student com (k1) graus de liberdade.
2.3.11 Estimacao de
2
Um estimador nao viesado de
2
e:

2
= QME.
Pode-se mostrar que:
(n k)QMR

2
tem distribuicao de
2
com (n k) graus de liberdade. A partir deste fato, obtemos que
um intervalo de conanca para
2
com coeciente = 1 e dada por:
_
(n k)QMR

2
c
1
;
(n k)QMR

2
c
2
_
onde
2
c
1
e
2
c
2
sao respectivamente, os quantis de ordem (1

2
) e (

2
) da distribuicao
2
com (n k) graus de liberdade.
2.3.12 Estimacao de
2
A
Sabemos que: E(QME) =
2
+ r
2
A
e E(QMR) =
2
. Assim, um estimador nao
viesado de
2
A
e:

2
A
=
QME QMR
r
Pode ocorrer que, em um particular experimento,
2
A
assuma um valor negativo. Como
nao tem sentido o fato de uma variancia ser negativa, devemos, em tais casos, considerar
que a estimativa de
2
A
e nula.
Para a construcao de um intervalo de conanca para
2
A
, necessitamos da distribuicao
de (QME-QMR). No entanto, e bastante difcil determinar-se a distribuicao exata dessa
estatstica. Bulmer (1957) apresenta metodos aproximados de construcao de intervalos de
conanca para
2
A
. Nao vamos, entretanto, inclu-los neste texto.
Peres, Tavares & Madruga
36 Experimentos com um fator
2.3.13 Estimacao de

2
A

2
Podemos ter interesse em estimador

2
A

2
. Este quociente e uma medida da relacao exis-
tente entre a variacao entre a varia cao as medias
i
e a variacao interna dos tratamentos.
Pode ser provado (Neter, 1974) que um intervalo de conanca para

2
A

2
com coeciente
de conanca = 1 e dado por.
_
1
r
_
QME
QMR
.
1
F
2
1
_
;
1
r
_
QME
QMR
.
1
F
1
1
__
onde, F
1
e F
2
sao, respectivamente, os quantis de ordem

2
e
_
1

2
_
da distribuicao
F-snedecor com (k 1) e (n k) graus de liberdade.
2.3.14 Estimacao de

2
A

2
A
+
2
Esta quantidade e, em geral, de grande interesse na analise de experimentos com um
fator aleatorio, pois representa a proporcao da variancia total atribuda aos tratamentos,
ou seja, a proporcao da variancia total correspondente `a variacao entre as medias
i
.
A partir do intervalo de conanca para

2
A

2
dado pela relacao (2.18), obtemos que um
intervalo de conanca para

2
A

2
A
+
2
com coeciente de conanca = 1 e dada por:
_
L
i
1 +L
i
;
L
s
1 +L
s
_
,
onde
L
i
=
1
r
_
QME
QMR
.
1
F
2
1
_
e L
s
=
1
r
_
QME
QMR
.
1
F
1
1
_
e F
1
e F
2
, sao respectivamente, os quantis de ordem (

2
) e (1

2
) da distribuicao F-snedecor
com (k 1) e (n k) graus de liberdade.
Peres, Tavares & Madruga
2.3 Experimentos com um fator Aleatorio 37
2.3.15 Exemplo
Considerando os dados apresentados na Tabela 2.10, obtemos as seguintes estimativas.
Parametro Estimativa por ponto Intervalo de conanca( = 0.95)
26,85 [23,07;30,63]

2
3,08 [1,68;7,38 ]

2
A
8,50

2
A

2
[0,54;59,64]

2
A

2
+
2
A
[0,35;0,98]
Observando os resultados acima, conclumos que a temperatura media da especie em
estudo e 26,85
o
c e que a variabilidade entre as medias das temperaturas dos animais
explica de 0,35 a 0,98 da variabilidade total. Notamos tambem que a variabilidade entre
as temperaturas medias dos animais de toda a especie e grande em relacao `a variabilidade
da temperatura de cada animal.
Peres, Tavares & Madruga
Captulo 3
Experimentos com Dois Fatores
3.1 Introducao
Neste captulo apresentaremos a analise de experimentos com dois fatores. A diferenca
que surge no caso de dois fatores tanto pode ser quanto ao tipo de planejamento, quanto
`a possvel interferencia de efeito de um fator sobre o outro. Por exemplo, duas drogas
podem ter efeitos positivos com relacao `a sa ude, mas quando combinadas podem trazer
resultados negativos. Esta possvel interacao sera vista mais adiante.
Para melhor compreendermos os tipos de planejamento que podem ocorrer quando temos
dois fatores envolvidos em um experimento, consideremos os exemplos a seguir.
EXEMPLO 3.1 (Classicacao Cruzada) - Uma companhia tem interesse em investi-
gar o efeito de preco de venda e tipo de companha publicitaria nas vendas de um de seus
produtos. Para isto ela vai realizar um experimento considerando tres precos de venda (R$
100,00, R$110,00 e R$ 120,00 ) e dois tipos de campanha publicitaria (an uncio em radio
e an uncio em jornal).
Temos, neste exemplo, um experimento com dois fatores: preco de venda (fator A) e
tipo de campanha publicitaria (fator B) com 2 e 3 nveis, respectivamente. Combinado
cada nvel de A com um nvel de B, obtemos 6 tratamentos, descritos na Tabela 3.1.
Tabela 3.1 - Experimento com 2 fatores
Classicacao cruzada
Tratamento Descricao
1 R$100,00 radio
2 R$110,00 radio
3 R$120,00 radio
4 R$100,00 jornal
5 R$110,00 jornal
6 R$120,00 jornal
EXEMPLO 3.2 (Classicacao Hierarquica)- Um industrial tem tres maquinas que
produzem um tipo de bacia de plastico. Dois operadores diferentes trabalham em uma
40 Experimentos com Dois Fatores
das maquinas. Seu objetivo e avaliar o efeito de maquina e operador na exibilidade do
produto.
Os fatores de interesse neste experimento sao tipo de maquina (fator A) com tres nveis
e operador (fator B) com dois nveis. Combinando os nveis desses fatores obtemos 6
tratamentos, descritos na Tabela 3.2.
Tabela 3.2 - Experimento com 2 fatores
Classicacao Hierarquica
Tratamento Descricao
1 Maquina 1 Joao
2 Maquina 1 Carlos
3 Maquina 2 Raimundo
4 Maquina 2 Antonio
5 Maquina 3 Jose
6 Maquina 3 Nonato
Notemos que, no Exemplo 3.1 os tres precos de vendas considerados sao os mesmos para
cada tipo de veicula cao publicitaria. Ja no Exemplo 3.2, os fatores se combinam de uma
forma diferente, pois os operadores diferem de maquina para maquina. Em experimentos
do tipo considerado no Exemplo 3.1, onde cada nvel de um fator esta combinado com
todos os nveis do outro fator, dizemos que os fatores obedecem a uma classicacao cru-
zada (experimentos cruzados). Em experimentos nos quais existe uma hierarquia entre os
nveis dos fatores, isto e, os nveis de um fator (operador) sao especcos a cada nvel do
outro fator (maquina), temos uma classicacao hierarquica (experimentos hierarquicos).
Dizemos neste caso que operadore um subfator do fator maquina.
A analise estatstica de um experimento com dois fatores depende da forma como eles
estao combinados e tambem do fato deles serem xos ou aleatorios. Vamos apresentar a
an alise de cada tipo de experimento isoladamente. Antes, porem, e necessario introduzir-
mos a notacao que vai ser adotada neste captulo.
3.2 Notacao
Adotamos neste captulo a notacao abaixo para quantidades e parametros. Vale ressal-
tar que estamos supondo, por facilidade, que o experimentos e balanceado, ou seja, todos
os tratamentos tem o mesmo n umero de observa coes.
a e o n umero de nveis do fator A;
Peres, Tavares & Madruga
3.3 Experimentos cruzados xos 41
b e o n umero de nveis do fator B;
r e o n umero de obseervacoes a cada tratamento;
n
i.
= br e o n umero de observacoes no i-esimo nvel de A;
n
.j
= ar e o n umero de observa coes no j-esimo nvel de B;
n = abr e o n umero total de observa coes;
y
ijk
e a observacao correspondente `a k-esima unidade experimental submetida ao
i-esimo nvel de A e j-esimo nvel de B;

ij
e a media populacional da variavel dependente no i-esimo nvel de A e j-esimo
nvel de B;

i.
e a media populacional da variavel dependente no i-esimo nvel de A;

.j
e a media populacional da variavel dependente no j-esimo nvel de B;
e a media populacional da variavel dependente livre de qualquer tratamento.
Os estimadores dos parametros de medias
ij
,
i.
,
.j
e , sao dados, respectivamente,
por
y
ij.
=
1
n
r

k=1
y
ijk
y
i..
=
1
n
.j
b

j=1
r

k=1
y
ijk
y
.j.
=
1
n
.j
a

i=1
r

k=1
y
ijk
y
...
=
1
n
a

i=1
b

j=1
r

k=1
y
ijk
3.3 Experimentos cruzados xos
Nesta secao consideramos experimentos com dois fatores xos obedecendo a uma clas-
sicacao cruzada, que e a
Peres, Tavares & Madruga
42 Experimentos com Dois Fatores
3.3.1 Modelo
O modelo associado a este tipo de experimento e
y
ijk
= +
j.
+
j
+
ij
+e
ijk
(3.1)
com i = 1, . . . , a; j = 1, . . . , b; k = 1, . . . , r, onde:

i
e o efeito do i-esimo nvel do fator A, denido como:

i
=
i.

j
e o efeito do j-esimo nvel do fator B, denido como:

j
=
.j

ij
e o efeito da interacao entre o i-esimo nvel de A e o j-esimo nvel de B e e denido
como:

ij
=
ij
( +
i
+
j
)

ij
=
ij

i.

.j
+
e
ijk
e um erro casual associado `a observa cao y
ijk
.
3.3.2 Suposicoes associadas ao modelo
Vamos supor que os erros e
ijk
sao variaveis aleatorias independentes e identicamente
distribudas com distribuicao N(0,
2
), isto e,
e
ijk
N(0,
2
), independentes
Das denicoes dos parametros do modelo seguem-se as seguintes restricoes:
a

i=1

i
= 0,
b

j=1

j
= 0;
a

i=1

ij
= 0, j e
b

j=1

ij
= 0, i;
Como conseq uencia das suposicoes feitas sobre a distribuicao dos erros, temos que:
y
ijk
N( +
i
+
j
,
2
), independentes.
Peres, Tavares & Madruga
3.3 Experimentos cruzados xos 43
3.3.3 Interpretacao dos parametros do modelo
Efeitos principais: os efeitos
i
e
j
, i = 1, . . . , a; j = 1, . . . , b sao denominados efeitos
principais. Observando o modelo (3.1), notamos que, se nao existe efeito de interacao,
y
ijk
= +
j.
+
j
+e
ijk
Dizemos neste caso que os efeitos de A e B sao aditivos. Em experimentos deste tipo
toda a informacao sobre o efeito dos fatores A e B na variavel dependente pode ser obtida
fazendo-se inferencias apenas sobre as medias
j.
e
.j
. Isto decorre do fato de que, em
experimentos aditivos, a diferenca entre as medias populacionais em quaisquer 2 nveis de
um fator a mesma qualquer que seja o nvel do outro fator, isto e:

ij

i

j
= c
1
i = i

ij

ij
= c
2
j = j

,
onde c
1
e c
2
sao constantes.
Em experimentos onde ocorre interacao, essa diferenca nao e constante, ou seja, o padrao
de diferenca, entre os nveis de um fator depende dos nveis do outro fator. Consideremos,
por exemplo, um experimento com dois fatores A e B com 2 e 3 nveis respectivamente.
Na Figura 3.1(d) representamos gracamente a existencia de interacao e na Figura 3.1(c)
a nao existencia de interacao desse efeito. Esses gracos sao conhecidos como Gracos
de Pers e sao extremamente uteis em uma primeira averiguacao vusual sobre interacoes
entre fatores, podendo haver as seguintes situacoes:
(a) Existe efeito de A, mas nao de B
(b) Existe efeito de B, mas nao de A
(c) Existe efeito de A, de B, mas nao de interacao AB
(d) Existe efeito de A, de B, e interacao AB
(e) Nao existe nenhum efeito
Pela propria denicao,
ij
e a diferenca entre
ij
e o valor que deveria ser esperado
se os fatores fossem aditivos. Em experimentos onde existe efeito de interacao, para avali-
armos os efeitos existentes na variavel dependente, devemos vericar o efeito de um fator
dentro da cada nvel do outro. Por exemplo, interacao entre um fator Droga (com 2 nveis,
digamos) e o fator Sexo, indica que o efeito da droga nao e o mesmo para homens e mu-
lheres; se no primeiro nvel da droga a resposta media for maior para o sexo masculino, no
segundo nvel a diferenca pode aumentar ainda mais, inverter-se, ou ainda tornar-se nula.
Peres, Tavares & Madruga
44 Experimentos com Dois Fatores
Figura 3.1 Gracos de Pers
(a) Efeito de A, mas no de B
4
4,5
5
5,5
6
6,5
7
7,5
B1 B2 B3
Nveis do Fator B
M

d
i
a

d
a

v
a
r
i

v
e
l

r
e
s
p
o
s
t
a
A1
A2
Efeito de A e B, com interao
4
6
8
10
12
14
16
B1 B2 B3
Nveis do Fator B
M

d
i
a

d
a

v
a
r
i

v
e
l

r
e
s
p
o
s
t
a
A1
A2
(c) Efeito de A e B, sem interao
4
5
6
7
8
9
10
11
12
13
B1 B2 B3
Nveis do Fator B
M

d
i
a

d
a

v
a
r
i

v
e
l

r
e
s
p
o
s
t
a
A1
A2
(b) Efeito de B, mas no de A
4
5
6
7
8
9
10
11
B1 B2 B3
Nveis do Fator B
M

d
i
a

d
a

v
a
r
i

v
e
l

r
e
s
p
o
s
t
a
A1
A2
3.3.4 Hipoteses
Nossas hipoteses gerais sao:
H
01
:
1
=
2
= . . . =
a
= 0 (nao existe efeito do fator A)
H
02
:
1
=
2
= . . . =
b
= 0 (nao existe efeito do fator B)
H
03
:
11
=
12
= . . . =
ab
= 0 (nao existe efeito de interacao).
3.3.5 Particao da soma dos Quadrados Total
Consideremos a identidade:
y
ijk
y
..
= (y
i..
y
...
) + (y
.j.
y
...
) + (y
ij.
y
i..
y
.j.
+ y
...
) + (y
ijk
y
ij.
)
=
i
+

j
+

ij
+ e
ijk
(3.2)
Peres, Tavares & Madruga
3.3 Experimentos cruzados xos 45
Elevando ao quadrado ambos os lados dessa relacao e somando em relacao aos ndices
i, j e k, obtemos:
SQT = SQA+SQB +SQR.
SQT e denominada soma de quadrados total e e uma medida de variabilidade das ob-
servacoes em relacao `a media geral estimada; SQA, denominada soma dos quadrados do
fator A, e uma medida da variabilidade das medias amostrais dos nveis de A em relacao
a y
...
. Da mesma forma, SQB (soma dos quadrados do fator B) e uma medida de variabili-
dade das medias y
.j.
em relacao `a media amostral geral y
...
. A expressao SQAB e chamada
soma de quadrados de interacao AB.
O n umero de graus de liberdade associado a cada soma de quadrados e apresentado na
Tabela 3.3.
Tabela 3.3 - N umero de graus de liberdade associado a cada soma de quadrados
em um experimento cruzado com dois fatores
Soma de quadrados Graus de liberdade (gl)
SQA a-1
SQB b-1
SQAB (a-1)(b-1)
SQR ab(r-1)
SQT abr-1
3.3.6 Esperanca dos quadrados medios (EQM)
A Estatstica adotada para se testar uma hipotese e sempre a relacao entre dois quadrados
medios. No entanto, e atraves das EQM que decidimos qual deve ser o denominador de
uma SQ para testar a hipotese. Via de regra, sob a hipotese considerada, o numerador
e o denominador devem ter a mesma EQM. Vale ressaltar que no caso de experimentos
com fatores xos e classicacao cruzada, ca bastante trivial, pois sempre dividimos pelo
QMR (Quadrado Medio dos Resduos), o que nao ocorre quando temos fatores aleatorios
ou classicacao hierarquica.
Peres, Tavares & Madruga
46 Experimentos com Dois Fatores
Pode-se mostrar que:
E
_
SQA
a 1
_
= E(QMA) =
2
+
rb
a 1
+
a

i=1

2
i
E
_
SQB
b 1
_
= E(QMB) =
2
+
ra
b 1
+
b

i=1

2
j
E
_
SQAB
(a 1)(b 1)
_
= E(QMAB) =
2
+
r
(a 1)(b 1)
+
a

i=1
b

j=1

2
ij
E
_
SQR
(ab)(r 1)
_
= E(QMR) =
2
Portanto, QMR e um estimador nao viesado de
2
; QMA e um estimador nao viesado de

2
sob H
01
, o mesmo ocorrendo para QMB sob H
02
, e QMAB sob H
03
.
3.3.7 Estatsticas e regioes crticas par os testes
Pelo mesmo argumento utilizado em experimentos como um fator, as estatsticas para
o teste das hipoteses H
01
, H
02
e H
03
sao as apresentadas a tabela apresentamos tambem
a distribuicao de cada estatstica so a hipotese nula, obtidas com auxlio do teorema de
Cochran (Neter, 1974, pag.55).
Tabela 3.2. - Estatsticas para os testes de hipotese em experimento com dois fatores
xos e suas distribuicoes sob a condicao de que essas hipoteses sao verdadeiras
Hipotese (H
0
) Estatstica Distribuicao da
Estatstica sob H
0
H
01
:
1
= . . . =
a
= 0 F
01
=
QMA
QMR
F
a1,ab(r1)
H
02
:
1
= . . . =
b
= 0 F
02
=
QMB
QMR
F
b1,ab(r1)
H
03
:
1
= . . . =
ab
= 0 F
03
=
QMAB
QMR
F
(a1)(b1);ab(r1)
Assim, rejeitamos H
01
ao nvel de signicancia se
F
01
> F
a1, ab(r1),
Peres, Tavares & Madruga
3.3 Experimentos cruzados xos 47
onde F
01
> F
a1,ab(r1),
, e o quantil de ordem (1- ) da distribuicao de F-Snedecor com
(a-1) e ab (r-1) graus de liberdade. As regioes crticas para os testes de H
02
e H
03
sao,
respectivamente, formadas pelos valores de F
02
e F
03
tais que:
F
02
> F
b1, ab(r1),
e
F
03
> F
(a1)(b1), ab(r1),
onde F
b1,ab(r1),
e F
(a1)(b1),ab(r1),
sao os quantis de ordem (1- ) das respectivas
distribuicoes das estatsticas.
3.3.8 Anova
O quadro da Analise de Variancia para a analise de experimentos cruzados com dois
fatores e dado na Tabela 3.3.
Tabela 3.3. - ANOVA para experimentos com dois fatores
FV g.l SQ QM F
A a-1 SQA QMA F
01
=
QMA
QMR
B b-1 SQB QMB F
02
=
QMB
QMR
AB (a-1)(b-1) SQAB QMAB F
03
=
QMAB
QMR
Resduo ab(r-1) SQR QMR
Total abr -1 SQT
3.3.9 Estimacao dos parametros do modelo
Os estimadores de mnimos quadrados dos parametros do modelo (3.1) sao obtidos
minimizando-se a expressao:
a

i=1
b

j=1
r

k=1
(y
ijk

i

j

ij
)
2
Peres, Tavares & Madruga
48 Experimentos com Dois Fatores
sob as restricoes:
a

i=1

i
= 0,
b

j=1

j
= 0
a

i=1

ij
= 0
b

j=1

j
= 0
Assim procedendo obtemos os estimadores dados na tabela 3.4.
Tabela 3.4 - Estimadores de mnimos quadrados dos parametros
de modelo (3.1) e das medias
i.
,
.j
e
ij
Parametro Estimador
y
...

i
y
i..
y
...

j
y
.j.
y
...

ij
y
ij.
y
i..
y
.j.
+ y
...

i.
y
i..

.j
y
.j.

ij
y
ij.
3.3.10 Exemplo
Em um experimento cinco grupos de peixes Mandi foram injetados com glucagonio
(200 g por animal, independente de seu peso) e foram sacricados 5, 15, 30, 90, e 360
minutos apos a injecao. Foi medida a glicemia (mg%) de cada animal imediatamente apos
a sua morte. O objetivo do pesquisador e comparar a glicemia media dos peixes tratados
com glucagonio com a dos que recebem a solucao salina (controle) nos cinco templos
considerados. Os dados observados encontram-se na Tabela 3.5.
Os fatores envolvidos neste experimento sao:
(a) Fator A: substancia. Os nveis de A sao: (glucagonio) e A
2
(salina).
(b) Fator B: tempo apos a injecao. Os nveis de B sao: B
1
(5 min), B
2
(15 min), B
3
(30
min), B
4
(90 min), e B
5
(360 min).
Na Tabela 3.6 apresentamos as medias amostrais das observa coes em cada casela e na
Tabela 3.7 o quadro de analise de variancia correspondente a este experimento.
Peres, Tavares & Madruga
3.3 Experimentos cruzados xos 49
Tabela 3.5 - Dados observados no estudo da glicemia (mg%)de peixes mandi
substancia tempo 5 min 15 min 30 min 90 min 360 min
42.16 82.47 137.27 74.06 52.78
46.75 82.55 129.67 78.38 61.43
53.25 78.03 127.94 80.79 56.29
64.74 84.87 120.46 92.16 46.25
Glucagonio 53.22 77.52 125.22 96.00 53.38
54.22 71.52 111.51 80.76 40.94
55.86 98.00 128.00 95.35 45.13
41.97 78.14 127.06 85.43 64.85
64.44 86.63 118.60 79.11 57.65
61.78 90.84 126.95 74.79 57.72
65.35 65.25 54.47 53.38 63.28
71.44 56.66 68.95 65.45 50.87
48.48 49.57 44.13 74.69 53.05
67.34 51.73 49.47 52.07 40.00
Salina 50.75 69.63 60.81 52.94 69.29
55.90 61.35 43.02 59.71 57.65
59.87 55.75 53.48 60.20 58.15
58.98 60.25 55.05 54.50 59.23
58.91 47.50 51.24 61.35 57.84
57.80 53.50 53.20 64.51 58.20
Tabela 3.6 - Medias amostrais observadas no estudo de glicemia
(mg%) de peixes mandi
Tempo
Substancia 5 min 15 min 30 min 90 min 360 min Total
Glucagonio 53,91 83,06 125,27 83,68 53,64 79,91
Salina 59,48 57,12 53,41 59,88 56,76 57,33
total 56,70 70,09 89,34 71,78 55,20 68,62
Observando a Tabela 3.7, conclumos que a glicemia media dos peixes:
nao e a mesma para as duas substancias:
nao e a mesma nos 5 tempos considerados;
Peres, Tavares & Madruga
50 Experimentos com Dois Fatores
Tabela 3.7 - Quadro de analise de variancia de experimento
realizado para o estudo da glicemia de peixes Mandi
FV g.l SQ QM F P
A 1 12.739,637 12.739,637 224,652 0,0000
B 4 15.279,992 3.819,998 67,362 0,0000
AB 4 19.502,864 4.875,716 85,979 0,0000
Resduo 90 5.103,742 56,708
total 99 52.626,235
existe interacao entre substancia e tempo, isto e, o comportamento da glicemia media
no tempo nao e o mesmo para as duas substancias. Observando a Figura 3.2, notamos
que a glicemia media parece independer do tempo apos a aplicacao da substancia
injetada e o glucagonio.
Figura 3.2 Pers de medias
Tabela 3.8 - Comparacoes m ultiplas no estudo da glicemia de peixes Mandi
(metodo de Tukey)
Contraste Estimativa Intervalo de Conanca
C

C = 0, 95

11

21
-5,57 [-16,52; 5,38 ]

12

22
25,94 [ 14,99; 36,89]

13

23
71,86 [ 60,91; 82,81]

14

24
23,80 [ 12,85; 34,75]

15

25
-3,12 [-14,07; 7,83 ]
Podemos prosseguir a analise comparando as glicemias medias dos grupos tratados com
as duas substancias a cada tempo. Para isto vamos utilizar os metodos da comparacoes
m ultiplas apresentados no Captulo 2. Na Tabela 3.8 dispomos as estimativas por ponto e
por intervalo dos contrastes obtidas pelo metodo de Tukey. Conclumos que as glicemias
medias 15, 30 e 90 minutos apos a aplicacao nao sao iguais para as duas substancias,
sendo a glicemia media dos peixes tratados com glucagonio maior que a dos peixes que
receberam a substancia salina.
Peres, Tavares & Madruga
3.4 Experimentos cruzados aleatorios e cruzados mistos 51
3.4 Experimentos cruzados aleatorios e cruzados mistos
Nesta secao descreveremos a analise de dois tipos de experimentos cruzados: os expe-
rimentos cruzados aleatorios (A e B sao fatores aleatorios ) e os experimentos cruzados
mistos (A e xo e B e aleatorio). Os procedimentos de analise de tais experimentos sao bas-
tante parecidos com o adotado na secao anterior e, por este motivo, nos os apresentamos
de forma resumida nas Tabelas 3.9 e 3.10.
Notemos que o modelo independe dos fatores serem xos ou aleatorios. Entretanto os
efeitos correspondentes aos nveis de um fator aleatorio sao variaveis aleatorias, assim como
as medias da variavel dependente nesses nveis. Por exemplo, em experimentos cruzados
mistos nos quais B e um fator aleatorio,
j
e
.j
sao variaveis aleatorias, j = 1, . . . , b.
Observemos que estamos sempre supondo que as vaeriaveis envolvidas no modelo tem
distribuicao normal e sao independentes.
No que se refere `as hipoteses gerais, se um fator e xo, nosso objetivo e vericar se os
efeitos dos nveis presentes no experimento sao nulos; quando um fator e aleatorio, temos
interesse em fazer inferencias sobre toda a populacao de nveis desse fator e a hipotese
adequada e, neste caso, de que a variancia do efeito desse fator e nula. Por exemplo, as
hipoteses associadas ao modelo misto (A xo e B aleatorio) sao:
H
01
:
1
= . . . =
a
= 0
H
02
:
2
B
= 0
H
03
:
2
AB
= 0.
A estatstica para o teste de uma particular hipotese H
0
constitui no quociente de
dois quadrados medios escolhidos de tal forma que o valor esperado do numerador sob a
hipotese e igual ao valor esperado do denominador. A distribuicao dessa estatstica sob
H
0
e F-Snedecor com n umero de gruas de liberdade igual ao das somas de quadrados que
a compuseram. Rejeitamos a hipotese ao nvel de signicancia se o valor observado da
estatstica for maior que o quantil de ordem (1- ) dessa distribuicao.
Como conseq uencia do modelo e suposicoes apresentados na Tabela 3.9 temos que em
experimentos aleatorios,
y
ijk
N(,
2
),
onde

2
=
2
A
+
2
B
+
2
AB
+
2
Alem disso, e facil mostrar que a covariancia entre observacoes em uma mesma casela e
Cov(y
ijk
, y
ijk
) =
2
A
+
2
B
+
2
AB
e a covariancia entre observacoes de caselas diferentes e nula. Para experimenos mistos, as
implicacoes sao:
y
ijk
N( +
i
,
,2
),
Peres, Tavares & Madruga
52 Experimentos com Dois Fatores
Tabela 3.9 - Modelos associados a experimentos cruzados aleat orios e
mistos e suas respectivas suposicoes e restricoes
Classicacao dos Fatores
A e B aleatorios A xo e B aleatorio
Modelo y
ijk
= +
i
+
j
+
ij
+e
ijk
,(*)
i = 1, ..., a; j = 1, ..., b; k = 1, ..., r

i
N(0,
2
A
), independentes
j
N(0,
2
B
), independentes

i
N(0,
2
B
), independentes e
ijk
N(0,
2
), independentes
Suposicoes
ij
N(0,
2
AB
), independentes
j
e e
ijk
, sao independentes
e
ijk
N(0,
2
), independentes
ij
N(0,
2
AB
)

i
,
j
,
ij
e e
ijk
sao independentes

a
i=1

i
= 0
Restricoes

a
i=1

ij
= 0, para todo j.
(*) - Os componentes ,
i
,
j
,
ij
e e
ijk
seguem as denicoes dadas em 3.3.1
onde

2
=
2
+
2
B
+
2
AB
e
Cov(y
ijk
, y
ijk
) =
_

2
+
2
AB
se as observacoes estao na mesma casela;
0, se as observa coes estao em caselas diferentes.
3.5 Experimentos hierarquicos xos
Nesta secao vamos apresentar a analise de experimentos com dois fatores xos A e
B classicados de forma hierarquica, sendo B um subfator de A.
3.5.1 Modelo
O modelo associado a experimentos hierarquicos xos e:
y
ijk
= +
i
+
j(i)
+e
ijk
(3.3)
Peres, Tavares & Madruga
3.5 Experimentos hierarquicos xos 53
i = 1, . . . , a; j = 1, . . . , b; k = 1, . . . , r, onde:
e a media geral;

i
e o efeito do i-esimo nvel do fator A denido como

i
=
i.

j(i)
e o efeito do j-esimo nvel do fator B dentro do i-esimo nvel do fator A e e denido
como

j(i)
=
j(i)

i

.j(i)
e a media populacional da variavel dependente nesse tratamento, e
e
ijk
e um erro casual nao observavel.
Em comparacao deste modelo com o de fatores com classicacao cruzada, vemos que o
efeito
j(i)
incorpora duas componentes, a do fator B e da interacao AB, ou seja,

j(i)
=
j
+
ij
.
3.5.2 Suposicoes e restric oes associadas ao modelo
Vamos supor que os erros e
ijk
sao variaveis aleatorias independentes e identicamente
distribudas com distribuicao N(0,
2
), isto e,
e
ijk
N(0,
2
), independentes.
Assim, temos:
y
ijk
N( +
i
+
j(i)
,
2
), independentes.
Da denicao dos parametros do modelo (3.5) segue-se as seguintes restricoes:
a

i=1

i
= 0,
b

j=1

j(i)
= 0, i.
3.5.3 Hipoteses
As hipoteses que vamos tratar neste tipo de experimento sao:
H
01
:
1
=
2
= . . . =
a
= 0 (nao existe efeito do fator A),
H
02
:
1(i)
= . . . =
b(i)
= 0, i, (nao existe efeito de B dentro do i-esimo nvel A, i).
Peres, Tavares & Madruga
54 Experimentos com Dois Fatores
3.5.4 Particao da soma do Quadrado Total
Consideremos inicialmente a identidade:
(y
ijk
y
...
) = ( y
i..
y
...
) + ( y
ij.
y
i..
) + (y
ijk
y
ij.
)
Elevando ao quadrado os dois membros dessa identidade e somando em relacao aos
ndices i, j e k, obtemos a seguinte igualdade:
a

i=1
b

j=1
r

k=1
(y
ijk
y
...
)
2
=
a

i=1
( y
i..
y
2
...
) +
a

i=1
b

j=1
( y
ij.
y
2
i..
)
a

i=1
b

j=2
r

k=2
(y
ijk
y
ij.
)
2
SQT e a soma de quadrados total e mede a variabilidade das observacoes em relacao
`a media geral, sem considerar os tratamentos; SQA e a soma dos quadrados do fator A
e mede a variabilidade das medias amostrais a cada nvel de A em relacao `a media geral
y
...
; SQB
A
mede a variabilidade das medias amostrais dos nveis de B dentro de cada
nvel do fator A, para todo nvel de A e SQR e a medida de variabilidade interna de cada
tratamento (variacao residual).
SQB
A
pode ser partida em a somas de quadrados, do tipo:
SQB
A
i
=
b

j=1
r( y
ij.
y
i..
)
2
, i = 1, . . . , a.
SQB
A
i
e uma medida da variabilidade entre medias dos nveis de B dentro do i-esimo
nvel do fator A.
Na Tabela 3.11 apresentamos o n umero de graus de liberdade associados a SQR, SQB
A
i
,
SQR e SQT.
3.5.5 Esperanca dos Quadrados Medios
Considerando o modelo (3.5) e as suposicoes e restricoes associadas a esse modelo,
pode-se demonstrar que:
E
_
SQA
a 1
_
= E(QMA) =
2
+
br
a 1
+
a

i=1

2
i
E
_
SQB
(A)
a(b 1)
_
= E(QMB
(A)
) =
2
+
r
a(b 1)
+
a

i=1
b

i=1

2
j(i)
E
_
SQB
A
i
(b 1)
_
= E(QMB
A
i
) =
2
+
r
(b 1)
+
b

j=1

2
j(i)
E
_
SQR
(ab)(r 1)
_
= E(QMR) =
2
Peres, Tavares & Madruga
3.6 Experimentos hierarquicos aleatorios e Experimentos hierarquicos mistos 55
Portanto, temos que QMR e um estimador nao viesado de
2
se a hipotese H
01
for
verdadeira. Sob H
02
, QMB tambem e um estimador nao viesado de
2
.
3.5.6 Estatsticas e regiuoes crticas pra os testes de H
01
e H
02
Na Tabela 3.12 apresentamos as estatticas para os testes das hipoteses H
01
e H
02
dadas em (3.6.3), bem como suas distribuicoes sob essas hipoteses.
Rejeitamos H
01
ao nvel de signicancia se
F
01
> F
a1, ab(r1),
,
onde F
a1,ab(r1)
e o quantil de ordem (1 ) da distribuicao F-Snedecor com (a 1) e
ab(r 1) graus de liberdade.
Rejeitamos H
02
ao nvel de signicancia se:
F
02
> F
a(a1), ab(r1),
,
sendo F
a(a1),ab(r1),
e o quantil de ordem (1) da distribuicao F-Snedecor com a(b1)
e ab(r 1) graus de liberdade.
Caso rejeitemos H
02
, podemos colocar dentro de quais nveis de A ocorre diferenca entre
os nveis de B. Para isto devemos testar isoladamente a hipoteses:
H
0
i
:
1(i)
= . . . =
b(i)
= 0
A estatstica para cada teste e:
F
02
i
=
QMB
(A
i
)
QMR
sob H
0
i
, F
02
i
tem distribuicao F-Snedecor com (b 1) e ab(r 1) graus de liberdade.
Rejeitamos H
0
i
ao nvel de signicancia se F
02
i
for maior que o quantil de ordem (1)
dessa distribuicao.
3.5.7 Anova
Na Tabela 3.13, apresentamos o quadro de Analise de Variancia para a analise de um
experimento hierarquico com 2 fatores xos.
3.6 Experimentos hierarquicos aleatorios e Experimentos hierarquicos
mistos
Peres, Tavares & Madruga
56 Experimentos com Dois Fatores
3.6.1 Analise
Descrevemos sucintamente nas Tabelas 3.14 e 3.15 a analise de experimentos hierarquicos
aleatorios e mistos. Por essas tabelas, temos que o modelo em experimentos mistos e
aleatorios, a particao da soma de quadrados total e n umero de graus de liberdade asso-
ciado a cada fonte de variacao sao identicos aos apresentados na analise de experimentos
hierarquicos xos. No entanto, pelas mesmas razoes mencionadas na Secao 3.4, a presenca
de ao menos um fator aleatorio implica em suposicoes adicionais sobre os componentes do
modelo.
modicacao nas hipoteses a serem testadas e nas correspondentes estatsticas de teste.
O modelo e suposicoes apresentadas na Tabela 3.14 implicam que, em modelos aleatorios:
y
ijk
N(,
2
+
2
A
+
2
B
),
Cov(y
ijk
, y
i,j,k,
) =
_

2
A
+
2
B
se y
ijk
, y
i,j,k,
estao na mesma casela; (3.1)
0, se as observacoes estao em caselas diferentes.
Para modelos mistos seguem-se que:
y
ijk
N(,
i
+
2
A
+
2
B
),
Cov(y
ijk
, y
i,j,k,
) =
_

2
B
se y
ijk
, y
i,j,k,
se as observacoes pertencem a mesma casela;
0, se estao em caselas diferentes.
(3.4)
3.6.2 Exemplo(SEA-8025)
Um pesquisador deseja vericar se existe diferenca entre os comprimentos medios da
folha de plantas Petunia Hybridaclassicadas em um dos seguintes grupos segundo o
seu nvel de ploidia:
Grupo 1: plantas diploides (2m)
Grupo 2: plantas com incedencia de celulas diploides (2m - 3m)
Grupo 3: plantas com incidencia de celulas triploides (3m - 2m)
Grupo 4 plantas com incedencia de celulas tetraploides (4m - 8m).
Peres, Tavares & Madruga
3.6 Experimentos hierarquicos aleatorios e Experimentos hierarquicos mistos 57
Ele deseja tambem saber se as plantas de cada grupo tem o mesmo comprimento da
folha. Foi entao realizado um experimento, sorteando-se 5 plantas de cada grupo de ploidia
e medindo-se 20 vezes o comprimento da folha de cada planta. Esse n umero (20) foi baseado
em experimento realizados anteriormente. Os dados obtidos encontram-se na Tabela 3.16.
Neste exemplo temos um experimento com dois fatores:
Fator A: grupo de ploidia (xo com 4 nveis) e
Fator B planta (aletorio com 5 nveis), obedecendo a uma classicacao hierarquica.
A variavel dependente e:
Y = comprimento da folha
A ANOVA correspondente a este exemplo e:
Peres, Tavares & Madruga
58 Experimentos com Dois Fatores
De uma tabela da distribuicao F-Snedecor, obtemos que
F
3;16 ; 0,05
= 3, 24 e F
3;360;0,05
= 1, 63
Portanto, conclumos que existe diferenca entre os componentes basicos medios das
folhas de plantas com ploidia diferentes. Alem disso, dentro de cada grupo, o comprimento
das folhas nao e constante para todas as plantas.
Como o fator A e xo, podemos utilizar os metodos de compracoes m ultiplas descritos na
Secao 2.2.13 com o objetivo de localizar as diferncas entre os grupos ploidia. Neste exemplo
vamos comparar as medias dos quatro grupos duas a duas, isto e, vamos considerar os
contrastes
C
ij
=
i.

j.
, i = j
e testar hipoteses:
H
0
: C
ij
= 0,
atraves dos intervalos de conanca fornecidos pelo metodo de Tukey.
Utilizando os resultados dados em (3.4), obtemos que a variancia de:

C
ij
= y
i..
y
j..
e dada por:

V ar(

C
ij
) =
2QMB
(A)
br
,
Neste caso, o intervalo de conanca ( = 1 ) fornecido pelo metodo de Tukey e:
_
( y
i.. y
j..
) q
c
_
QMB
(A)
br
; ( y
i.. y
j..
) +q
c
_
QMB
(A)
br
_
onde q
c
e o quantil de ordem (1 ) da distribuicao studentized rangecom parametros
r = a e v = (a 1)(b 1).
Na Tabela 3.17 apresentamos as estimativas por ponto e por intervalo dos contrastes
C
ij
de interesse neste experimento.
Pelos resultados apresentados na Tabela 3.17 concluimos que as plantas dos grupos
1, 2, e 3 tem o mesmo comprimento medio das folhas, que e diferente do comprimento das
folhas do grupo 4.
Como rejeitamos a hipotese:
H
0
:
2
= 0,
e interessante estimarmos esse parametro e construirmos um intervalo de conanca para

2
B
/(
2
+
2
B
). Um estimador nao viesado para
2
B
pode ser obtido a partir da ANOVA e
e dado por:

2
B
=
QMB
(A)
QMR
r
Peres, Tavares & Madruga
3.6 Experimentos hierarquicos aleatorios e Experimentos hierarquicos mistos 59
No nosso exemplo, temos que

2
B
= 83, 15
Um intervalo de conanca para
2
/(
2
+
2
B
) com coeciente de conanca de = 1 e:
_
L
1
1 +L
1
;
L
2
1 +L
2
_
onde:
L
1
=
1
r
_
1
F
2
.
QMB
(
A)
QMR
1
_
;
L
2
=
1
r
_
1
F
1
.
QMB
(
A)
QMR
1
_
e F
1
e F
2
sao, respectivamente, os quantis de ordem

1
e 1

2
da distribuicao de F-Snedecor
com a(b 1) e ab(r 1) graus de liberdade. No nosso exemplo com 0, 95 esse intervalo e:
[0, 42; 0, 77] ,
ou seja, a proporcao da variancia total devida `a variacao entre os comprimentos medios
das folhas e um valor entre 0,42 e 0,77.
Peres, Tavares & Madruga
60 Experimentos com Dois Fatores
T
a
b
e
l
a
3
.
1
0
-
A
N
O
V
A
p
a
r
a
e
x
p
e
r
i
m
e
n
t
o
s
c
r
u
z
a
d
o
s
a
l
e
a
t
o
r
i
o
s
e
m
i
s
t
o
s
F
V
g
.
l
S
A
Q
M
E
Q
M
E
s
t
a
t

s
t
i
c
a
d
e
T
e
s
t
e
A
a
-
1
S
Q
A
=

a i
=
1
b
r
(
y
i
.
.

y
.
.
.
)
2
Q
M
A
=
S
Q
A
a

2
+
r
b

2
+
r

2 A
B

2
+
r
b

2 A
B
+
r
b
a

a i
=
1

2 i
Q
M
A
Q
M
A
B
Q
M
A
Q
M
A
B
B
b
-
1
S
Q
B
=

a j
=
1
a
r
(
y
.
j
.

y
.
.
.
)
2
Q
M
B
=
S
Q
B
b

2
+
r
a

2
+
r

2 A
B

2
+
r

2 A
B
Q
M
B
Q
M
A
B
Q
M
B
Q
M
R
A
B
(
a
-
1
)
(
b
-
1
)
S
Q
A
B
=

a i
=
1

b j
=
1
r
(
y
i
j
.

y
i
.
.

y
.
j
.
y
.
.
.
)
2
Q
M
A
B
=
S
Q
A
B
(
a

1
)
(
b

1
)

2
+
r

A
B

2
+
r
b

2 A
B
Q
M
A
B
Q
M
R
Q
M
A
B
Q
M
R
r
e
s

d
u
o
a
b
(
r
-
1
)
S
Q
R
=

a i
=
1

b j
=
1

r k
=
1
(
y
(
i
j
k

y
i
j
.
)
2
Q
M
R
=
S
Q
R
a
b
(
r

1
)

2
t
o
t
a
l
a
r
b
-
1
S
Q
T
=

a i
=
1

b j
=
1

r k
=
1
(
y
i
j
k

y
.
.
.
)
2
Peres, Tavares & Madruga
3.6 Experimentos hierarquicos aleatorios e Experimentos hierarquicos mistos 61
Tabela 3.11 - N umero de graus de liberdade associado a cada soma
de quadrados em um experimento cruzado com dois fatores
Soma de quadrados Graus de Liberdade (gl)
SQA a-1
SQB
A
a(b-1)
SQB
A
1
b-1
.
.
.
.
.
.
SQB
A
a
b-1
SQR ab(r-1)
SQT abr-1
Tabela 3.12 - Estatsticas para teste de hipoteses em um experimento
hierarquico com dois fatores xos e suas distribuicoes sob essas hipoteses
Hipotese (H
0
) Estatstica Distribuicao da
Estatstica sob H
0
H
01
:
1
= ... =
a
= 0 F
01
=
QMA
QMR
F
a1,ab(r1)
H
02
:
1(i)
= ... =
b(i)
= 0, F
02
=
QMB
A
QMR
F
a(b1),ab(r1)
Tabela 3.13 - ANOVA para experimentos hierarquicos aleatorios e mistos,
suas suposicoes e restricoes
FV (gl) SQ QM F
A a-1 SQR QMA F
01
= QMA/QMR
B
(A)
a(b-1) SQB
(A)
QMB
(A
1
)
F
02
= QMB
(A)
/QMR
B
(A
1
)
b-1 SQB
(A
1
)
QMB
(A
1
)
F
02
1
= QMB
A
1
/QMR
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
B
(Aa)
b-1 SQB
(Aa)
QMB
(Aa)
F
02a
= QMB
(Aa)
/QMR
SQR ab(r-1) SQR QMR
resduo abr-1 SQT
Peres, Tavares & Madruga
62 Experimentos com Dois Fatores
Tabela 3.14 - Modelos associados a experimentos cruzados aleatorios e
mistos e suas respectivas suposicoes e restricoes
Classicacao dos fatores
A e B aleatorios A xo e B aleatorio
Modelo y
ijk
= +
i
+
j
+
ij
+e
ijk
,(*)
i = 1, ..., a; j = 1, ..., b; k = 1, ..., r

i
N(0,
2
A
), independentes
j
(
i)
N(0,
2
B
), independentes

j
(
i)
N(0,
2
B
), independentes e
ijk
N(0,
2
), independentes
Suposicoes e
ijk
N(0,
2
), independentes
j
e e
ijk
, sao independentes

i
,
j
(
i)
e e
ijk
sao independentes
Restricoes

a
i=1

i
= 0
(*) - ,
i
,
j
(
i)
e e
ijk
seguem as denicoes dadas na sec ao 3.5.1.
Tabela 3.15- ANOVA para experimentos cruzados aleatorios e mistos
FV g.l SA QM EQM Estatstica de Teste
A Q-1 SQA=

a
i=1
br( y
i..
y...)
2
QMA=
SQA
a1

2
+ r
2
B
+ br
2
A

2
+ rb
2
B
+
br
Q1

a
i=1

2
i
QMA
QMB
(A)
QMA
QMB
(A)
B
(A)
a(b-1) SQB
(A)
=

a
j=1
r( y
ij.
y
i..
)
2
QMB
(A)
=
SQB
A
a(b1)

2
+ r
2
B
+ r
2
AB

2
+ r
2
B
QMB
(A)
QMR
QMB
(A)
QMR
AB (a-1)(b-1) SQAB=

a
i=1

b
j=1
r( y
ij.
y
i..
y
.j.
y
...
)
2
QMAB =
SQAB
(a1)(b1)

2
+ r
AB

2
+ rb
2
AB
QMAB
QMR
QMAB
QMR
resduo ab(r-1) SQR=

a
i=1

b
j=1

(
k=1
y
(
ijk y
ij.
)
2
QMR =
SQR
ab(r1)

2

2
total arb-1 SQT=

a
i=1

b
j=1

r
k=1
(y
ijk
y
...
)
2
* A e xo e B e aleatorio.
Tabela 3.15a - ANOVA
FV g.l SQ QM F
A 3 50.785,028 16.928,343 9,826
B
A
16 27.564,660 1.722,791 28,783
Resduo 380 22.744,750 59,855
total 399 101.094,438
Peres, Tavares & Madruga
3.6 Experimentos hierarquicos aleatorios e Experimentos hierarquicos mistos 63
Tabela 3.16 - Dados observados no estudo da glicemia (mg%)de peixes mandi
Tipos de Ploidia A
1
Plantas dentro
de cada
grupo B
1
B
2
B
3
B
4
B
5
61 62 50 60 49 56 59 55 45 30 50 59 45 65 60 82 81 95 69 107
61 52 47 58 51 53 73 46 48 32 58 61 41 56 59 69 77 87 60 93
41 45 50 48 48 47 61 50 51 32 70 55 46 75 60 82 67 95 55 108
49 58 45 47 53 51 60 42 46 28 70 55 42 63 66 82 85 85 80 93
43 61 50 59 44 52 67 49 47 25 73 65 42 80 52 82 68 85 64 93
52 62 40 53 49 44 67 43 47 25 63 50 55 65 58 94 55 80 67 99
46 55 41 60 57 41 60 49 49 20 63 47 41 77 63 82 67 80 61 89
48 53 46 63 46 60 57 43 53 20 68 55 55 74 62 80 61 84 65 87
48 44 45 52 51 44 46 44 43 27 52 46 41 60 62 74 66 80 63 63
44 50 48 57 56 53 58 40 43 22 58 44 36 66 60 82 63 78 50 59
59 41 43 60 51 64 60 43 47 19 51 51 53 60 43 77 65 88 58 54
45 50 45 52 42 52 55 43 47 22 53 62 57 59 54 77 57 85 59 57
40 54 46 49 50 48 51 48 39 21 58 28 41 62 51 76 60 82 47 72
35 43 45 55 46 42 57 32 46 16 58 56 37 57 62 70 72 77 50 71
47 48 41 51 43 47 44 43 51 18 56 60 43 54 54 69 60 78 62 88
40 46 589 41 41 44 54 44 55 20 55 42 31 60 48 77 59 76 55 90
47 48 45 49 52 54 48 55 43 15 48 43 39 55 49 69 57 71 49 93
42 56 47 49 40 42 53 48 47 15 43 40 39 56 62 79 56 73 65 93
38 36 60 49 38 54 39 40 42 15 41 48 36 57 80 77 60 70 55 99
49 50 46 36 40 48 46 35 40 14 35 53 32 55 57 60 61 65 55 87
y
i..
46.05 50.7 46.95 52.4 47.35 49.65 55.75 43.95 46.456 21.85 56.16 52.5 42.7 62.75 57.4 77 64.65 80.65 59.45 84.7
y
i..
48.69 43.53 54.2 73.33
Tabela 3.17 - Contrastes dos comprimentos medios das folhas dos 4 grupos de ploidia
Contraste Estimativa Intervalo de Conanca
C

C = 0, 95

1.

2.
2,16 [-15,27;19,59 ]

1.

3.
-5,61 [-23,04;11,82]

1.

4.
-25,00 [-42,43;-7,57]
Peres, Tavares & Madruga

Você também pode gostar