Você está na página 1de 49

Aspectos Importantes da Estatstica na Pesquisa

e Experimentao
_____________________________________________________________________________________________________________

Prof. Carlos Sigueyuki Sediyama


Universidade Federal de Viosa
Departamento de Fitotecnia

VIOSA - MG
MAIO - 2010

Proibida a reproduo, parcial ou total, sem autorizao expressa do autor


ii

Aspectos importantes da Estatstica na pesquisa e


experimentao
Preleo apresentada pelo Prof. Carlos
Sigueyuki Sediyama no 2o Curso de
Redao Cientfica promovido pela
EPAMIG Zona da Mata, Vila Gianetti, 47
Viosa, MG, dia 17/05/2010, das 16 h 30
min s 18 h 30 min.

1. INTRODUO
Este roteiro tem como objetivo orientar as discusses de alguns aspectos da
Estatstica na pesquisa cientfica. Levanta questes relacionadas com os procedimentos e
metodologias empregados nas experimentaes agrcolas, os quais visam obteno de
informaes teis ao pesquisador, em seu esforo de tentar promover o desenvolvimento
da agricultura.
Sero abordados poucos itens em razo da exiguidade de tempo, porm importantes
de serem compreendidos, pois so elementos que devem ser lembrados na elaborao de
projetos, ajudam na compreenso dos resultados obtidos nos experimentos e facilitam a
exposio desses resultados aos interlocutores interessados.
No sero apresentados clculos, nem como aplicar os mtodos de anlise dos
dados, porm sero apontados alguns itens que devem ser lembrados na conduo de
experimentos e podem auxiliar na obteno de informaes teis desses experimentos.

1.1.

O que um experimento

Realizamos experimentos todo o tempo. Operrios novos na cidade desejam


encontrar o trajeto mais curto ou mais rpido at seus locais de trabalho; mestres-cuca
experimentam novas receitas; engenheiros da computao tentam produzir computadores
mais rpidos e confiveis; e etc. Os objetivos geralmente so as melhorias nos processos
ou nos produtos, ou encontrar o nvel timo, tal como o caminho mais curto para o
trabalho.
No nosso caso, considera-se experimento, ou ensaio, a investigao planejada para
a obteno de novos fatos, ou para confirmar ou rejeitar os resultados de experimentos
anteriores, que iro auxiliar numa deciso administrativa, tais como: recomendar certa
variedade, indicar determinado procedimento, receitar um defensivo, ordenar a aplicao
de quantidade correta de fertilizante, produzir um novo equipamento, etc.
Tais experimentos podem ser enquadrados em trs categorias:
1. Experimentos preliminares;
2. Experimentos crticos; e
3. Experimentos demonstrativos.
Nessa seqncia, experimento da categoria anterior serve de orientao para o da
categoria seguinte.
Experimentos preliminares - O nmero de tratamentos grande. O nmero de repeties
pode ser pequeno e inclusive pode ser igual a 1 (um). Auxilia na escolha dos
tratamentos a serem estudados nos experimentos crticos.
1

Experimentos crticos - So experimentos em que as respostas aos tratamentos so


comparadas. O nmero de observaes suficiente para dar segurana razovel na
determinao de diferenas significativas.
Experimentos demonstrativos - So experimentos conduzidos em trabalhos de extenso,
com o objetivo de comparar um novo tratamento, ou novos tratamentos, com um padro
(tratamento tradicional ou antigo).
Nos experimentos, essencial definir a populao para a qual as inferncias sero
aplicadas, deline-los de maneira adequada e realizar medies nas variveis sob estudo.
O experimento , ainda, um conjunto de regras usadas para retirar amostras da
populao.

1.2.

Objetivos de um experimento

No delineamento de um experimento, devem-se estabelecer, claramente, os seus


objetivos, tais como: questes a serem respondidas, hipteses a serem testadas, efeitos a
serem estimados, etc. aconselhvel classificar os objetivos em principais e secundrios,
pois alguns delineamentos oferecem maior preciso na comparao de alguns tratamentos
e menor na comparao de outros.
Todo experimento realizado para fornecer respostas a uma ou mais questes.
Com isso em mente, o investigador decide quais comparaes entre tratamentos oferecem
informaes relevantes; conduz o experimento para medir ou para testar hipteses relativas
s diferenas entre tratamentos, sob condies comparveis; e realiza medies e
observaes no material experimental. De posse das informaes obtidas do experimento
conduzido com sucesso, responde s questes inicialmente formuladas.
Bons experimentos consistem da formulao de perguntas de interesse, para a rea
em estudo, e da correta aplicao dos procedimentos experimentais que respondero a
essas questes.

1.3.

Definio de Estatstica

Para o cientista, especialmente aquele da rea biolgica, a Estatstica comeou por


volta de 1925, quando apareceu a publicao de FISHER intitulada Statistical Methods
for Research Workers.
A Estatstica foi desenvolvida para resolver problemas cujas leis de causa e efeito
no so aparentes, tornando-se necessrio um enfoque objetivo. Nesses problemas, sempre
h alguma incerteza acerca de qualquer inferncia, em razo do nmero limitado de
observaes. Portanto, a seguinte definio razoavelmente satisfatria:
Estatstica a cincia, pura e aplicada, da criao, do
desenvolvimento e da aplicao de tcnicas, que permitem a
avaliao do grau de incerteza das inferncias induzidas
(STEEL e TORRIE, 1960).

2. CINCIA, PESQUISA E EXPERIMENTAO


2.1. O que cincia?
Conhecimento exato e racional de coisa determinada. Sistema de conhecimentos
com um objeto determinado e mtodo prprio.
H alguns anos, quando mencionada, cincia se referia aos domnios dos
conhecimentos nas reas naturais (cincias naturais), como fsica, qumica, astronomia,
geologia e biologia.
Atualmente, l-se sobre cincias sociais, cincias da engenharia, cincia da deciso,
cincia da administrao e outras. As cincias naturais, obviamente, como pioneiras,
estabeleceram os padres do que seja cincia.
Para que realmente seja cincia, deve-se ter:
Um grupo de praticantes em um domnio ou subdomnio do conhecimento, com
organizaes e publicaes relevantes, que seguem o mtodo cientfico em sua rea
de pesquisa e utilizam-se da reviso pelos pares.
No estdio da ao, h acompanhamento das pesquisas pelos pares. Artigos com
base no uso dos mtodos cientficos so primeiramente examinados pelos pares
quanto sua acurcia. Aps correo e aprovao final, os artigos so publicados
para serem questionados, testados, aprovados, usados etc. pelos pares.
Como um grupo, deve-se procurar a formao de um corpo organizado e confivel
de conhecimentos em sua rea de especializao.

2.2. Diagrama do processo de soluo de um problema.


Realidade

Extrao

Aplicao

Soluo
Figura 2.1. Diagrama do processo de soluo de um problema
O diagrama na Figura 2.1 mostra o modelo geral de como solucionar problemas. O
modelo possui trs estdios:
1. Extrao o problema terico para o qual uma soluo imaginada factvel
extrado do contexto real multilinear;
2. Soluo uma soluo encontrada para o problema terico extrado;
3. Aplicao a soluo ao problema extrado aplicada realidade multilinear.

2.3. Diagrama da evoluo da cincia


De acordo com Box (Box, G.E.P. Science and Statistics. Journal of the American
Statistical Association, 71, 791-799, 1976), a cincia a maneira de se aprender o que

mais que uma especulao terica e mais que a acumulao unidirecional de fatos
prticos. Ela progride pela alternncia de duas fases: deduo e induo.
Deduo comea com alguma agregao de teorias, modelos, conjeturas,
hipteses e idias. Faz predies e sugere maneiras de se observar o mundo e de se
coletar dados.
Induo comea com algumas observaes, dados, fatos e conhecimentos acerca
das prticas. Escolhe entre teorias e modelos com base nessas informaes. Pode,
tambm, construir sobre teorias, modelos e idias anteriores.

Exemplo ilustrativo do que sejam induo e deduo:


Suponha que voc tome vrias mas pequenas, duras e verdes. Todas se
apresentaram muito cidas. Da, voc generaliza que todas as mas pequenas,
duras e verdes so, provavelmente, cidas. Este o raciocnio indutivo (do
especfico para o geral).
Ento, voc toma outra ma pequena, dura e verde. Voc conclui que essa ma
ser, tambm, cida. Este o raciocnio dedutivo (do geral para o especfico).

Kuhn (Kuhn, T.S. The Structure of Scientific Revolutions, 2nd ed. The University of
Chicago Press, 1970.) considerou que til fazer a distino entre perodos de cincia
normal, durante o qual os problemas so resolvidos sem questionamentos das colees
coerentes de teorias aceitas (que ele as referencia como paradigmas) e perodos de crise e
revolues, quando quantidades substanciais de velhas teorias so descartadas e
substitudas por novas teorias (que ele descreve como a emergncia de novos paradigmas).
A Figura 2.2 uma tentativa de se ilustrar as idias de Box e de Kuhn em uma
nica imagem. Nela, o perodo de cincia normal, aquele durante o qual os passos
dedutivos fazem predies que variam apenas levemente, de acordo com as vrias
hipteses, idias e conjeturas consideradas. Os passos indutivos tomam observaes,
dados, fatos e tiram concluses acerca de quais hipteses; idias e conjeturas so
provavelmente acuradas, verdadeiras ou aproximaes teis. Os resultados de
experimentos ou de estudos observacionais geralmente so obtidos sem repeties nesse
perodo de cincia normal, porque h pouco conflito entre as idias que continuamente
evolvem das vrias pesquisas na rea de estudo.
Resultados experimentais com repeties
e estudos de observao com repeties
Observaes,
dados e fatos
Predies
(Setas para cima)
Inferncias
(Setas para baixo)

Hipteses, idias
e conjeturas
Modelos
Teorias
Paradigmas

Perodo de cincia normal


Perodo de crise
Figura 2.2. Diagrama do progresso irregular da cincia

Revoluo

O perodo de crise ocorre quando os modelos, as teorias e os paradigmas


geralmente aceitos no parecem satisfazer na predio de alguns aspectos do que tem sido
4

observado. Geralmente, duvidam-se dos dados antes que as teorias e os paradigmas sejam
questionados, de tal forma que, no perodo de crise, os pesquisadores geralmente repetem
os experimentos e os estudos observacionais. Durante o perodo de crise, predies
dedutivas podem ser feitas considerando modelos, teorias e paradigmas alternativos e as
predies geralmente iro diferir. Os passos indutivos durante o perodo de crise no so
aceitos por todos os pesquisadores da rea de estudo. Eles podem no aceitar que os dados
foram adequadamente repetidos. Alguns pesquisadores faro inferncias acerca de
hipteses e conjeturas menores, sem lanar qualquer dvida sobre seus modelos, teorias e
paradigmas solidamente arraigados. Outros pesquisadores inferem que modelos, teorias ou
paradigmas devem ser derrubados.
A revoluo ocorre quando as dedues derivadas dos vrios paradigmas so
diferentes e a induo oriunda de dados reproduzveis indica que uma mudana dos
paradigmas previamente aceitos necessria. Formas menos dramticas de revoluo
podem tambm ocorrer, quando modelos e teorias menos bsicas so derrubados.

2.4.

Diagrama de uma lista-de-conferncia de uma experimentao

Figura 2.3. - Diagrama de uma lista-de-conferncia de uma experimentao.

Na Figura 2.3 os nmeros identificam etapas ou recomendaes para a


experimentao:
1- Considere a quem consultar;
2- faa perguntas;
3- clarifique os objetivos;
4- decida se h necessidade de experimento;
5- considere cincia e tecnologia relevantes;
6- considere informaes de dados existentes;
7- liste variveis e fatores;
8- sumarie crenas e incertezas;
9- considere possveis transformaes de variveis de resposta e de fatores;
10- decida sobre a estratgia geral da experimentao;
11- decida sobre quais variveis de resposta sero mensuradas;
12- decida quais fatores e nveis sero includos;
13- procure eficincia;
5

1415161718192021222324-

decida quando, onde e com que material;


precavenha-se dos vcios;
selecione um delineamento experimental;
conviva com outras fontes de variao;
delineie um sistema de coleta de dados;
tente antecipar possveis problemas;
execute ensaios e colete os dados;
atualize crenas e incertezas;
reconsidere objetivo e estratgia planejada;
sumarie e comunique os resultados;
ajude as mudanas a ocorrerem.

O crculo externo se refere ao programa experimental geral e o crculo interno


conduo de um nico ensaio.
No estudo da estatstica experimental, no se deve concentrar apenas no
delineamento experimental e na anlise dos dados, que correspondem aos pontos do
crculo interno estratgia geral da experimentao e atualize crenas e incertezas. A
experimentao de sucesso requer que ambos os crculos funcionem muito bem.
importante que no se perca de vista o objetivo geral da experimentao (crculo externo)
enquanto se lida com grande nmero de tarefas necessrias ao trabalho de conduo de
experimentos (crculo interno).

2.5.

O mtodo cientfico

(Norman W. Edmund www.scientificmethod.com)


A expresso "mtodos cientficos", como usada hoje, refere-se aos processos ou s
tcnicas criativas, lgicas ou no-lgicas usadas no trabalho de resolver problemas.
Em um sentido estrito, os mtodos cientficos so tcnicas que geralmente
envolvem o uso das ferramentas, dos equipamentos e dos instrumentos.
Estdios do mtodo cientfico:
1- Observao curiosa;
2- h problema?
3- objetivos e planejamento;
4- procure, explore e acumule evidncias;
5- gere solues, alternativas criativas e lgicas;
6- avalie as evidncias;
7- faa adivinhaes educadas (hipteses);
8- desafie as hipteses;
9- chegue a uma concluso;
10- suspenda o julgamento;
11- aja;
Ingredientes de suporte ao mtodo cientfico:
12- mtodos criativos, no-lgicos, lgicos e tcnicos;
13- princpios e teorias dos procedimentos;
14- atributos e capacidade de raciocnio.

3. POPULAO, VARIVEIS E DADOS


R.A. FISHER, um dos fundadores da Estatstica, definiu a disciplina Estatstica
como o estudo das populaes, das variaes naturais e da reduo de dados.
O uso original da Estatstica sugere que era o estudo das populaes de pessoas,
vivendo em unio poltica. Atualmente, j no h tal restrio: h uma multiplicidade de
espcies de populaes estudadas pelos estatsticos.
Resumidamente, pode-se definir populao como a coleo de todos os possveis
valores de uma varivel aleatria. Uma varivel aleatria uma funo que associa um
valor a um resultado de um experimento. Se tivermos as alturas de todos os estudantes
matriculados em uma escola, ser a populao de alturas e no de estudantes que estar em
estudo. A varivel aleatria ser a altura de um estudante. Se todos os valores da populao
forem conhecidos, ento conheceremos tudo sobre a varivel aleatria.
O conceito de populao leva, naturalmente, ao de variao. Uma populao de
indivduos idnticos seria completamente descrita pela descrio de um nico indivduo e
do nmero de indivduos. Entretanto, populaes sujeitas a estudo estatstico geralmente
mostram variao em um ou mais aspectos. Essa variao grandemente utilizada pelos
estatsticos.
Alm disso, necessita-se reduzir a massa de dados. difcil abarcar as
implicaes contidas em muitas pginas de nmeros. Entretanto, pode ser possvel
expressar todas as informaes relevantes com apenas algumas quantidades. Se soubermos,
por exemplo, que uma varivel aleatria tem distribuio normal, ento toda a
distribuio poder ser especificada apenas pela mdia e pela varincia.
Finalmente, pode-se entender que a estatstica, tendo como base os dados
observados, leva escolha entre dois ou mais cursos de ao. a rea da inferncia
estatstica.
Enquanto se estuda uma gama de maneiras de reduzir dados, de avaliar a variao
das populaes e de fazer inferncias, no se pode oferecer uma rotina universal aplicvel
a todas as situaes. Antes de iniciar qualquer estudo estatstico, o planejamento da
pesquisa deve responder a certos quesitos:
1. Que questes o estudo pretende responder?
2. A que classe de indivduos as respostas devem ser aplicadas? queles indivduos
examinados ou a algum grupo maior?
3. Se as respostas devem ter alguma importncia geral, alm dos casos observados, como
a amostra deve ser tomada? Qual o tamanho da amostra? H algum elemento viciante
no plano proposto para a seleo da amostra de indivduos a serem examinados?
4. Que observaes devero ser feitas nesses indivduos? Como?
5. Como os dados devem ser reunidos para anlise?
6. Que medidas sumariantes sero computadas?
7. Como os resultados devem ser apresentados?
Variveis
As observaes so a matria bruta com a qual o pesquisador trabalha. Para que a
estatstica seja aplicvel a essas observaes, elas devem estar na forma de nmeros. No
melhoramento de plantas, os nmeros podem ser a produo por parcela; na pesquisa
mdica, pode ser o tempo de recuperao sob vrios tratamentos; na indstria, pode ser o
nmero de peas defeituosas em um determinado lote produzido por uma linha de
montagem. Tais nmeros constituem dados e sua caracterstica comum a variabilidade ou
a variao.

Sentenas como Mrcia morena ou Ele pesa muito mais que 90 quilos so
comuns e informativas. Elas se referem a caractersticas que no so constantes, mas
variam de indivduo para indivduo e, portanto, servem para distingui-los ou para descrevlos.
Caractersticas que mostram variabilidade ou variao so chamadas variveis ou
variveis aleatrias.
Resumidamente, na Figura 3.1 mostrada a classificao das variveis, segundo
sua natureza.
VARIVEL
No-ordenvel
(Nominal)

Ordenvel

Com escala
Contnua

Sem escala
Discreta

(QUANTITATIVA)

(QUALITATIVA)

FIGURA 3.1. Classificao das variveis aleatrias

3.1.

Populaes e Amostras

Se um nico grupo particular de indivduos, que est sendo estudado (por exemplo,
estudantes matriculados na UFV neste semestre), for de interesse, ento os valores da
varivel aleatria para esses indivduos formam a populao. Se as observaes
particulares sero usadas para fazer inferncias sobre indivduos no observados (por
exemplo, todos os estudantes universitrios de Minas Gerais), os valores observados das
variveis aleatrias formam uma amostra da populao maior.

3.2.

Mdias e desvios padres

Uma estatstica muito comum e muito conhecida a mdia (mdia aritmtica). Para
uma varivel aleatria x, as observaes so escritas como x, e a mdia, uma medida de
tendncia central, a soma das observaes dividida pelo nmero de observaes.
x
Simbolicamente, x
.
n
Para medir a disperso da distribuio, ou para indicar a variabilidade, usa-se o
desvio padro. Na verdade, inicialmente define-se a varincia (s2) de uma amostra como a
mdia dos quadrados dos desvios em relao mdia:
1
2
2
(x x)
s
n 1
8

A raiz quadrada de s2, representada por s, o desvio padro.


Uma relao muito til aquela entre o desvio-padro e a mdia, denominada de
s
s
coeficiente de variao, calculada como: C.V. , ou C.V. 100% .
x
x

3.3.

Distribuio Normal
A distribuio normal tem funo de densidade igual a

1 Y 2
1
(
)
, - < y < +,
2

e
2
em que e so parmetros da distribuio normal.
A mdia e a varincia da distribuio normal so, respectivamente, E(Y) = e
2
(Y) = 2; isto , Y ~ N(, 2).

f ( Y)

3.3.1. Teorema do Limite Central


Se Y1, ..., Yn so observaes aleatrias independentes, provenientes de uma
populao com funo de probabilidade f(Y), para a qual 2 (Y) finita, ento, quando o
n

Yi

tamanho da amostra n razoavelmente grande, a mdia da amostra Y , Y =


distribuio aproximadamente normal, com mdia E(Y) e varincia

, tem

2 (Y)
.
n

3.3.2. Teorema da Regra Emprica


Se a distribuio dos dados segue aproximadamente a forma de sino, ento,
68 % das observaes se encontram no limite de um desvio-padro da mdia;
95 % das observaes se encontram no limite de dois desvios-padres da mdia; e
99,7 % das observaes se encontram no limite de trs desvios-padres da mdia.

3.3.3. Distribuio Normal Padro


Se Y uma varivel com distribuio normal, com mdia e varincia 2, isto ,
Y
Y ~ N(, 2), ento, Z
uma varivel com distribuio normal padro, com

mdia zero e varincia igual a um, ou seja: Z ~ N(0, 1).


rea = 0,75

z0,75
Algumas tabelas de z do a rea hachurada, at um dado valor de z. A rea mais
prxima de z0,75 encontrada em uma dessas tabelas de z 0,7486, que corresponde ao valor
9

da rea de 0,67. Portanto, z0,75=0,67. Ou seja, abaixo do valor 0,67 esto 75% das
observaes dessa distribuio.

3.3.4. Distribuio de Qui-Quadrado ( )


2

Sejam z1 + z2 + ... zv, variveis independentes com distribuio normal padro.


Ento, define-se (2v ) = z12 + z 22 + ... + z 2v , em que v o nmero de graus de liberdade.

3.3.5. Distribuio t
Sejam z e
Definimos t(v) =

(2v ) variveis independentes, respectivamente normal padro e 2 .

z
1
2

em que z e (2v ) so independentes.

(2v )

v
A distribuio t possui um parmetro, o grau de liberdade v.

3.3.6. Distribuio F
Sejam (2v1 ) e (2v2 ) duas variveis aleatrias 2 independentes. Definimos
(2v1 )
F( v1 ,v2 ) =

v1
, em que (2v1 ) e (2v2 ) so independentes.
(2v 2 )

v2
A distribuio F possui dois parmetros, o grau de liberdade do numerador v 1 e o
grau de liberdade do denominador v2.
s12
2
F tambm 21 .
s2
22

s12
, com n1 1 e n2 1 gl.
s 22
QMTR
Um teste F muito frequente : F
, com os gltr e gle.
QME
Se H0; 12 = 22 ,

F=

4. ANLISE DE VARINCIA
4.1. Definies
Anlise de varincia: processo aritmtico da partio da soma de quadrados total
em componentes associados a causas reconhecidas de variao.

10

Experimento: uma inquirio planejada. Respostas a diferentes tratamentos so


comparadas, por meio de observaes suficientes para dar segurana razovel na deteco
de diferentes significativas.
Tratamento: procedimento cujo efeito deve ser medido e comparado com outros de
mesma natureza. O tratamento pode ser uma taxa padro, um plano de pulverizao, uma
combinao temperatura x umidade, etc.
Unidade experimental ou parcela experimental: a unidade de material ao qual
aplicado um tratamento. Uma unidade experimental pode ser um animal, dez rvores, meia
folha, etc.
Unidade amostral: material em que as medidas dos efeitos dos tratamentos so
realizadas. Pode ser uma frao da unidade experimental, por exemplo, uma planta medida
em uma parcela com vrias plantas.
Erro experimental: variao entre observaes realizadas em unidades
experimentais que receberam o mesmo tratamento. Essa variao provm de duas fontes
principais: a variabilidade do material experimental e a variao que resulta de qualquer
falha na uniformizao da conduo fsica do experimento. Exemplo: Num experimento
em que se estuda a nutrio de ratos, h a variao entre animais, em razo de diferenas
em suas constituies genticas (variao intrnseca do material experimental) e h
variao entre gaiolas, nas quais so colocados os ratos, que podem estar dispostos em
diferentes temperaturas, iluminao e outros fatores (variao por erro na conduo fsica
do experimento).
O experimento deve diminuir essas fontes de erro. Assim, pode-se manejar o
material experimental para que o efeito da variabilidade inerente seja reduzido e a tcnica
experimental seja apropriada.

4.4.1. Controle do erro experimental


O erro experimental pode ser controlado, ou reduzido, pelos seguintes artifcios:
1. Uso de delineamento experimental adequado.
2. Uso de observaes concomitantes.
3. Escolha do tamanho e da forma das unidades experimentais.

4.4.2. Refinamento da tcnica


Nenhuma anlise estatstica ou outra pode melhorar os dados obtidos de um
experimento mal conduzido. de responsabilidade de o pesquisador conduzir
cuidadosamente seu experimento.
Exemplos:
Se possvel, utilizar um material experimental mais homogneo (e.g., linha pura vs
populao segregante).
Se um experimento completo de campo no pode ser colhido em um dia,
desejvel fazer a colheita de um ou dois blocos completos em cada dia.
Se um experimento em laboratrio ser conduzido por vrios laboratoristas,
desejvel que cada um deles conduza um ou mais conjuntos completos de tratamentos.

4.4.3. Repeties e suas funes


As repeties permitem a estimao do erro experimental (se2), reduzem a varincia
da mdia da amostra (isto , aumenta a preciso) e aumentam o escopo do experimento
(pelo uso de ampla gama de unidades experimentais).

11

Um experimento em que cada tratamento aparece apenas uma vez tem apenas uma
repetio. Nesse caso, pode-se dizer, tambm, que no h repetio; no se pode estimar o
erro experimental; no h meio de se saber se a diferena entre duas observaes causada
pela diferena entre tratamentos ou causada pela variao do material experimental.
Maior nmero de repeties implica em maior preciso na estimativa da mdia da
populao. Se a diferena de 5 unidades detectada pelo uso de 4 repeties, um
experimento com 16 repeties detectar diferenas de aproximadamente 2,5 unidades,

porque os desvios padres das mdias tm razo 2:1, ou seja,


e
,
4
16
respectivamente.
O nmero de repeties a ser empregado em um experimento depende, portanto, da
variabilidade do material experimental e da variabilidade das condies de conduo do
experimento (solo, clima, etc.). Repeties do experimento em vrios anos e, ou, em vrios
locais podem ser consideradas tipos maiores de repeties
Infelizmente, o nmero de repeties muito freqentemente determinado
principalmente pelos recursos financeiros e tempo disponveis para a conduo do
experimento. No h muito significado em se conduzir experimentos em que a escassez de
recursos no permite a obteno de dados com a preciso almejada. A soluo postergar
o experimento at que haja recurso suficiente ou reduzir do nmero de tratamentos, de tal
forma que haja repeties e preciso suficientes para os tratamentos remanescentes. O
nmero prtico de repeties para um experimento aquele em que o custo adicional em
material, tempo, mo-de-obra, etc. no mais compensado pelo ganho em informaes.

4.4.4. Escolha dos tratamentos


Em certos tipos de experimentos, os tratamentos tm efeito substancial sobre a
preciso do experimento. Esse fato especialmente verdadeiro no caso de experimentos
fatoriais.
Em alguns experimentos, a quantidade ou nvel de certo fator importante.
Suponha que o pesquisador est medindo o efeito de nveis crescentes de certo nutriente no
crescimento da planta. importante incluir diversos nveis para determinar se a resposta
linear ou curvilinear por natureza. Aqui, a escolha do nmero de nveis e seu intervalo so
importantes para a obteno de respostas apropriadas para as questes formuladas.
Em geral, quanto maior o conhecimento do investigador acerca dos tratamentos,
melhor ser o procedimento do teste estatstico imaginvel pelo estatstico. Esse
conhecimento geralmente dita a espcie e a quantidade de um determinado tratamento,
num conjunto de tratamentos. Isso, por sua vez, pode influenciar a preciso do
experimento.

4.4.5. Inferncia estatstica


Como j mencionado, o objetivo de um experimento determinar se h diferenas
reais entre as mdias dos tratamentos e estimar a magnitude de tais diferenas se elas
existirem. Uma inferncia estatstica acerca de tais diferenas envolve a alocao de uma
medida de probabilidade inferncia. Para isso, necessrio que a casualizao e a
repetio sejam introduzidas no experimento de maneira apropriada.
A repetio assegura os meios de computar o erro experimental.
A casualizao assegura uma medida vlida do erro experimental.

12

5. EXPERIMENTOS FATORIAIS
Experimentos fatoriais no so delineamentos. Nos experimentos fatoriais, o
investigador compara todos os tratamentos que podem ser formados pela combinao dos
nveis dos diferentes fatores.
O conceito de experimento fatorial pode ser ilustrado por alguns exemplos:
Considere um experimento para avaliar a capacidade produtiva de diversas variedades de
feijo. Suponha que um segundo fator, espaamento entre fileiras, seja de interesse. Um
experimento fatorial poderia ser planejado, de tal forma que os tratamentos consistissem da
combinao das variedades com os espaamentos escolhidos, isto , cada variedade estaria
presente em todos os espaamentos. (Num experimento com um s fator, todas as
variedades seriam plantadas em um s espaamento, ou todos os espaamentos seriam
estudados em uma s variedade.) Em solos, um experimento poderia ser planejado para
comparar todas as combinaes de vrias doses de fsforo e de potssio. Em experimento
de nutrio animal, poderiam ser estudadas vrias quantidades e fontes de protena.
Um fator, portanto, um tipo de tratamento (variedade, espaamento, fsforo,
potssio, fonte de protena, etc.).
O termo nvel se refere aos diversos tratamentos dentro de qualquer fator. Exemplo:
Se o fator for variedade, os nveis sero as variedades A, B, C, etc.; se o fator for fsforo,
os nveis sero as suas doses (0, 50, 100, etc. kg/ha).
Os experimentos fatoriais so usados em praticamente todos os campos de
pesquisa. Eles so de grande valia nos trabalhos exploratrios, em que pouco se tem
conhecimento dos nveis timos dos fatores, nem mesmo se sabe quais deles so
importantes. Considere uma nova cultura para a qual diversas variedades promissoras so
disponveis, mas que pouco se sabe a respeito da melhor poca ou densidade de plantio.
Nesse caso, um experimento fatorial com os trs fatores seria indicado. Entretanto, se a
opo for pelo estudo de um-fator-por-vez, define-se, por exemplo, a data e a densidade
de plantio e conduz-se um experimento com as variedades a serem avaliadas. Nesse caso, a
variedade que melhor se comporta na data e densidade de plantio escolhidas pode no ser a
melhor em outra poca ou outra densidade de plantio. Esse raciocnio tambm vlido,
quando se deseja testar pocas, fixando-se a variedade e a densidade.
Em outras situaes, o pesquisador pode estar principalmente interessado na
interao entre fatores, isto , ele deseja saber se as diferenas de respostas aos nveis de
um fator so semelhantes ou diferentes nos diferentes nveis de outro fator ou fatores.
Como ilustrao do fatorial mais simples, considere um experimento de beterraba,
com dois fatores. O primeiro fator nitrognio, aplicado em dois nveis: zero (no) e 300
quilos de sulfato de amnio por hectare (n1); o segundo fator profundidade de aradura,
tambm em dois nveis: 17 e 27 cm. Consequentemente, temos um fatorial 2x2. As quatro
combinaes so mostradas a seguir, com as respectivas produes mdias (mdias das
repeties).
Tratamento

Produo (kg/ha)

1 - no, 17 cm
2 - n1, 17 cm
3 - no, 27 cm
4 - n1, 27 cm

4090
4780
4240
5020

Esses resultados podem ser colocados no quadro 2x2 seguinte:


13

Profundidade
17 cm
27 cm
Mdia
27 cm vs 17 cm

no
4090
4240
4160
+150

Nitrognio
n1
Mdia
4780
4440
5020
4630
4900
+240
+190

Resposta a n1
+690
+780
+740

Os resultados podem ser sumariados da seguinte maneira:


A aplicao de nitrognio aumentou a produo em 690 kg, com aradura rasa, e em
780 kg, com aradura profunda. Esses valores so chamados de efeitos simples do
nitrognio. Analogamente, para os efeitos simples da profundidade de aradura, pode-se
dizer que a aradura a 27 cm foi superior aradura a 17 cm, em 150 kg, na ausncia de
nitrognio, e em 240 kg, quando o nitrognio foi aplicado.
Suponhamos, agora, que a anlise de varincia tenha mostrado os seguintes
resultados:
Fonte de variao
F
Nitrognio
**
Profundidade
**
Interao N x Profundidade
** F significativo.
Nessa situao, os efeitos de nitrognio e de profundidade de aradura so aditivos.
Isto , a diferena entre os efeitos simples do nitrognio, isto , de 690 para 780, ocorreu
em razo da simples variao ao acaso. O valor 740, obtido pela diferena de 4900 menos
4160, d o comportamento geral da beterraba, quando se aplica nitrognio. Esse valor
denominado efeito geral do nitrognio. Analogamente, o efeito geral da profundidade de
aradura seria 4630 - 4440 = 190. Mantendo-se essa pressuposio de que os efeitos dos
fatores so independentes, ao invs de expressarmos os resultados em termos dos efeitos
simples, podemos substitu-los por uma expresso mais concisa e de maior preciso (uma
vez que mdia de maior nmero de observaes). Essa expresso seria: A aplicao de
nitrognio aumentou a produo em 740 kg, enquanto a aradura a 27 cm aumentou a
produo em 190 kg, quando comparada com a aradura a 17 cm.
Por outro lado, se considerarmos que os fatores no so independentes, isto , se
considerarmos que araduras profundas possibilitam s plantas desenvolverem um sistema
radicular mais vigoroso, essas, nesse caso, teriam melhor desenvolvimento com o nutriente
adicionado. A anlise de varincia teria resultado no seguinte quadro:
Fonte de variao
Nitrognio
Profundidade
Interao N x Profundidade
** F significativo

F
**
**
**

Conseqentemente, podemos prever que a resposta aplicao de nitrognio seria


maior com araduras mais profundas, conquanto, provavelmente, no se esperasse que as
diferenas fossem grandes. O experimento fatorial, ento, permite verificar se os fatores
so ou no independentes. No presente caso, se a profundidade de aradura realmente afeta
14

a resposta ao nitrognio, a diferena entre 780 kg (resposta ao nitrognio em aradura


profunda) e 690 kg (resposta ao nitrognio em aradura rasa) uma estimativa desse efeito.
A diferena (780 690 = 90) chamada de interao entre nitrognio e profundidade de
aradura.
Analogamente, podemos considerar que a superioridade das araduras profundas
sobre as araduras rasas afetada pela presena de nitrognio. Para se medir a interao
nesse caso, subtramos 150 de 240. A diferena ser igual a 90, que a mesma obtida
anteriormente. Isto ser sempre vlido para as tabelas 2x2, de dois fatores com dois nveis
cada.

Produtividade (kg/ha)

Fatorial 2 x 2
5200
4900
4600
17 cm

4300

27 cm

4000
1

2
Dose de N

Para melhor exemplificar os efeitos em um experimento fatorial, tomemos o


fatorial 2x2 do quadro seguinte:
Fatorial 2x2 ilustrando os efeitos simples, efeitos gerais e interao.

a1
30
36
33
6

CASO I
A
a2
32
44
38
12

Mdia
31
40
35,5
9

a2 - a1
2
8
5

a1
30
36
33
6

CASO II
A
a2
32
26
29
-6

Mdia
31
31
31
0

a2 - a1
2
-10
-4

Fator

Nvel
b1
b2
Mdia
b2 - b1

Fator

Nvel
b1
b2
Mdia
b2 - b1

15

CASO III
A
a2
32
38
35
6

Fator

Nvel
b1
b2
Mdia
b2 - b1

a1
30
36
33
6

Mdia
31
37
34
6

a2 - a1
2
2
2

Obs.: Os valores apresentados so mdias das repeties nos experimentos e todas as


diferenas so consideradas significativas.
As diferenas a2 - a1, em cada nvel de B, e as diferenas b2 - b1, em cada nvel de
A, so os efeitos simples. No caso I, o efeito simples de A no primeiro nvel de B 2; no
caso II, o efeito simples de B no segundo nvel de A -6.
Quando os efeitos simples de um determinado fator so dados em termos de mdia
sobre todos os nveis dos outros fatores, temos o efeito geral. O efeito geral do fator A, no
caso I, 5, isto , (2+8)/2 = 5. Como se pode notar, os efeitos gerais num fatorial so
medidos com o uso de mais observaes que os efeitos simples, isto , mede-se o efeito de
A em todos os nveis de B e tira-se uma mdia. A utilizao de mais observaes para se
avaliar o efeito geral denominada de efeito das repeties ocultas, o que d maior
preciso na avaliao do efeito geral, quando a interao ausente.
Os efeitos simples, nos casos I e II, diferem entre si, tanto para o fator A, quanto
para o fator B. Se considerarmos que essas diferenas so maiores que as causadas por
chance (erro experimental), a resposta diferencial denominada interao entre os dois
fatores. No caso III, os efeitos simples de A e de B so iguais aos efeitos gerais
respectivos. Portanto, quando h interao, os efeitos gerais devem ser considerados com
bastante cautela, observando-se com bastante ateno os efeitos simples. Quando no h
interao, podemos facilmente generalizar o efeito de um determinado fator.
No caso I, a resposta de A, ou aumento de a 1 para a2 maior no nvel b2 do que no
b1, isto , h mudana na magnitude da resposta.
No caso II, a resposta de A corresponde a aumento na presena de b 1 e diminuio
na presena de b2, isto , h mudana na direo da resposta.
No caso III, no h interao. Os efeitos apenas se somam, isto , para se obter o
valor 38 em a2b2, simplesmente somamos o efeito geral de A = 6 e o efeito geral de b = 2
ao valor a1b1 = 30. Ou seja, 38 = 30 + 6 + 2.
Graficamente, podemos representar os trs casos como seguem:

16

OBS.: A presena ou ausncia dos efeitos gerais nada informa sobre a presena ou a
ausncia de interao. A presena ou a ausncia de interao nada informa sobre a
presena ou a ausncia dos efeitos gerais, mas informa sobre a homogeneidade dos efeitos
simples.
Relembrando, quando se podem combinar os nveis de todos os fatores em um
nico experimento, este chamado fatorial.

5.1.

Exemplo de um Fatorial 3x3x2

Os dados do quadro seguinte so os resultados de um experimento conduzido em


casa de vegetao, com a finalidade de determinar a taxa de emergncia de sementes de
trs leguminosas, tratadas e no tratadas com um fungicida e plantadas em trs tipos de
solos. O delineamento utilizado foi o de blocos casualizados.
Os tratamentos formam um fatorial 3x3x2, e cada dado no quadro apresentado a
soma de trs repeties de 100 sementes cada.

17

Espcies
(A)
Alfafa (a1)

Trevo
vermelho
(a2)
Trevo
doce
(a3)
Total
a1+a2+a3

Fungicidas
(C)
no c1
sim c2
c1+c2
no c1
sim c2
c1+c2
no c1
sim c2
c1+c2
no c1
sim c2
c1+c2

Tipo de solo (B)


Argila siltosa Areia(b2)
(b1)
266
286
276
271
542
557
252
289
275
292
527
581
152
197
178
219
330
416
670
772
729
782
1.399
1.554

Argila (b3)
66
215
281
167
203
370
52
121
173
285
539
824

Esses dados inicialmente foram tabulados da seguinte maneira:


Tratamentos
Blocos
I
II
III
1 a1b1c1
2 a1b1c2
3 a1b2c1
. .
. .
18 a3b3c2
Totais de blocos

Total
b1+b2+b3
618
762
1.380
708
770
1.478
401
518
919
1.727
2.050
3.777

Totais de
tratamentos
266
276
286
.
.
121
3.777

A anlise de varincia desse experimento em blocos casualizados resultou em:


F.V.
G.l.
SQ
QM
F
Blocos
2
356,77
178,39
1,895 ns
Tratamentos
17
32041,50
1884,79
20,029**
Erro
34
3199,40
94,10
Total
53
35597,67
Como o F foi significativo para
nos componentes do fatorial:
F.V.
G.L.
Blocos
2
(Tratamentos)
(17)
A
2
B
2
C
1
AB
4
AC
2
BC
2
ABC
4
Erro
34
Total
53

tratamentos, a SQ para tratamentos foi desdobrado


SQ
356,77
(32041,50)
9900,11
16436,11
1932,02
658,44
194,03
1851,14
1069,65
3199,40
35597,67

18

QM
178,39
(188,79)
4500,06
8218,06
1932,02
164,61
97,02
925,57
267,41
94,10

F
ns
**
47,82**
87,33**
20,53**
1,75 ns.
1,03 ns.
9,84**
2,84*

Como a interao BC foi significativa, podemos fazer o seguinte desdobramento:


Interao BC
Fungicida (c)

Tipo de solo
(B)
b1
b2
b3
b1 + b2 + b3

c1
670
772
285
1727

c2
729
782
539
2050

c1 + c 2
1399
1554
824
3777 = G

O quadro da anlise de varincia do desdobramento :


F.V.
G.L.
SQ
Erro
34 3199,40
C dentro b1 1
193,39
C dentro b2 1
5,56
C dentro b3 1 3584,22

QM
94,10
193,39
5,56
3584,22

F
2,05 ns.
0,06 ns
38,09**

em que
SQC / c1

670 2 729 2
3.3
( r.a )

1399 2
233

193,39

( cra )

etc.
A interao ABC foi significativa, implicando que a interao BC difere com o
nvel de A. A interao ABC est sendo examinada por esse ngulo, porque a interao
BC foi significativa.
Pela observao da interao BC, pode-se concluir que a dificuldade est ligada ao
C, no solo argila. Procedemos, ento, ao exame dos efeitos simples de C, no solo argila
(b3) nos vrios nveis de A.
A tabela dos trs tipos de solos x fungicidas parece justificar esta aproximao.
Solo argila = (b3)
a1
a2
a3

c1
66
167
52

c2
215
203
121

281
370
173

Com base nessa tabela, podem-se calcular as seguintes somas de quadrados:


662 2152 2812

3700,17**
SQC dentro de a1 em b3 =
3
23
1672 2032 3702

216,00n.s.
SQC dentro de a2 em b3 =
3
23
522 1212 1732

793,50**
SQC dentro de a3 em b3 =
3
23

19

Algumas concluses importantes podem ser tiradas desse experimento:


1. No foi encontrada diferena entre as taxas de emergncia das sementes tratadas (c2) e
no-tratadas (c1), quando tomada na mdia das espcies, no solo argila-siltosa (b1) e no
solo arenoso (b2); entretanto, a diferena foi significativa, em favor de sementes
tratadas, no solo argila (b3).
2. Desde que a interao dos trs fatores foi significativa, mais anlises foram feitas, e
estas indicaram que, no solo argila, as sementes tratadas de alfafa (a1) e trevo doce (a3)
emergiram melhor que as no tratadas, enquanto no trevo vermelho (a2) no foi
encontrada diferena.
3. As diferenas entre as taxas de emergncia das sementes tratadas e no-tratadas, em
cada uma das trs espcies, no foram significativas nos solos argila-siltosa e arenoso.

5.2.

Anlise de uma srie de experimentos de mesmo delineamento


(Anlise conjunta de experimentos)

Suponhamos que foram conduzidos experimentos de competio de variedades de uma


espcie anual, em cinco locais, durante trs anos seguidos. Cada experimento era constitudo de
12 variedades e foi instalado em blocos casualizados, com quatro repeties. Dentre os doze
tratamentos, dois eram as testemunhas (1 a variedade mais cultivada e 2 a variedade mais
produtiva).
O quadro da anlise de varincia, com as fontes de variao e os graus de liberdade,
desse conjunto de experimentos ser:
Fonte de variao
Blocos/(Locais x Anos) (B/LxA)
Locais (L)
Anos (A)
Anos x Locais (AxL)
Variedades (V)
Varriedades x Locais (VxL)
Variedades x Anos (VxA)
Variedades x Locais x Anos (VxLxA)
Erro
Total

gl
45
4
2
8
11
44
22
88
495
719

O modelo matemtico correspondente :


Yijmn = + B/LxAj(mn) + Lm + An + AxLmn + Vi + VxLim VxAin + VxLxAimn + Eijmn.

O objetivo desse experimento foi avaliar dez novas variedades, comparando-as com a
variedade mais cultivada e com a mais produtiva da regio, bem como entre si. Portanto, as
inferncias sero aplicadas ao conjunto das doze variedades. Nesse caso, o efeito de variedades
fixo. A eventual nova variedade a ser escolhida e recomendada ser para toda a regio de
onde foram escolhidos os locais dos experimentos. Portanto, os locais so amostras da regio
de plantio. Nesse caso, locais de efeito aleatrio. Quanto aos anos em que os ensaios foram
conduzidos, so amostras dos futuros anos em que as variedades sero plantadas. Portanto, ano
e de efeito aleatrio. Naturalmente, as repeties, ou os blocos, so amostras das reas, sendo
de efeito aleatrio. Ento, os quadrados mdios esperados da anlise de varincia, considerando
o efeito de variedades fixo e os demais aleatrios, ser:
20

F.V.

Quadrado mdio esperado

B/LxA

e2 v 2B/LxA

e2 v 2B/LxA vr 2LxA avr 2L

e2 v2B/LxA vr2LxA r2A

AxL

e2 v 2B/LxA vr 2LxA

e2 r2VLA r2VA ar2VL a r2V

VxL

e2 r 2VLA ar 2VL

VxA

e2 r 2VLA r 2VA

VxLxA

e2 r 2VLA

Erro

e2

Na aplicao dos testes estatsticos, os termos a serem utilizados como erro so:
1.

Para testar os efeitos de locais ou de anos, utilizar o quadrado mdio da interao


LxA.

2.

Para testar a interao LxA, utilizar o quadrado mdio de blocos dentro de locias e
anos (B/LxA).

3.

Para testar as interaes VxL ou VxA, utilizar o quadrado mdio da interao


VxLxA.

4.

Para testar a interao VxLxA, utilizar o quadrado mdio do erro.

5.

Para testar o quadrado mdio de variedades, h necessidade de se compor a


seguinte expresso:
QMV + QMVLA = QMVL + QMVA, sob a hiptese de que 2V 0.
Portanto,
F(p,q)

QMV QMVLA
QMVL QMVA

Conforme SATTERTHWAITE, 1946, os novos graus de liberdade sero


aproximadamente:

QM V QM VLA2
QM V2 QM VLA2
gl V

q
e

gl VLA

QM VL QM VA2
QM VL2 QM VA2 .
gl VL

gl VA

Observao:
Uma vez compreendidos os modelos matemticos dos experimentos, algumas
perguntas importantes podem ser respondidas. Dentre elas, a seguinte:
Quais efeitos estariam confundidos se o experimento fosse instalado em apenas um
local, durante os trs anos?
21

O modelo matemtico para essa situao, envolvendo apenas anos, seria:


Yijn = + B/Aj(n) + An + Vi + VxAin + Eijn.
Comparando-o com o modelo completo, envolvento anos e locais:
Yijmn = + B/LxAj(mn) + Lm + An + LxAmn + Vi + VxLim + VxAin + VxLxAimn + Eijmn
percebe-se que o efeito de anos (A) estar confundido com o efeito da interao A x L, o efeito
de variedades (V) estar confundido com o efeito da interao VxL e o efeito da interao VxA
com a interao VxLxA. Ou seja, no h informao de como os anos afetariam os dados nos
diferentes locais; do que ocorreria com as variedades em outros locias; ou como seria a
interao VxA se os plantios fossem realizados em outros locais.
A tabela seguinte ilustra melhor essa interpretao:

Efeito ou efeitos
Experimento em apenas um local Experimento em vrios locais
An

An + AxLnm

Vi

Vi + VxLim

VxAin

VxAin + VxAxLimn

6. COMPARAES MLTIPLAS
6.1.

Noes bsicas e filosofia das comparaes mltiplas

6.1.1. Famlias de inferncias


Qualquer coleo de inferncias para as quais se reconhece que se deve considerar
alguma medida de erros combinada denominada famlia. Por convenincia, tambm
nos referimos correspondente coleo de inferncias, como uma famlia.
H diferentes tipos de famlias. A coleo das comparaes pareadas um
exemplo de uma famlia finita. Em alguns problemas, o investigador pode desejar
examinar qualquer contraste entre as mdias dos grupos (isto , uma combinao linear das
mdias dos grupos, em que os coeficientes da combinao linear somam a zero). Ento, a
famlia de inferncias potenciais infinita, consistindo em todos os contrastes.
Em resumo, so as seguintes as duas razes-chave para considerar um conjunto de
inferncias como uma famlia (Cox 1965):
i)
Considerar o efeito da escolha do contraste em razo da olhada-nosdados.
ii)
Assegurar a correo simultnea de um conjunto de inferncias, para
garantir uma deciso geral correta.

6.1.2. Taxas de erro


Seja uma famlia de inferncias e seja um Procedimento de Comparao
Mltipla-PCM para essa famlia. Pressupomos que cada inferncia que faz (ou pode
22

potencialmente fazer) seja ou correta ou errada. Seja M( , ) o nmero aleatrio de


inferncias erradas. Podemos definir as trs taxas de erro:
Taxa de Erro Familiar ou conjunto de famlias (EF):
EF( , ) = Pr{M( , ) > 0} .
Taxa de Erro por Famlia (EPF):
EPF( , ) = E{M( , ) }.
Taxa de Erro por Comparao (EPC):
EPC( , ) = E{M( , )}/ N( ).
Em muitos problemas, somente determinados tipos de erros so considerados e
controlados. Por exemplo, em problemas de teste de hipteses comum considerar apenas
os erros do tipo I, ou seja, M'( , ), em que M'( , ) < M( , ). Na seqncia, a
menos que se especifique ao contrrio, assumir-se- que as taxas de erro sero do tipo I.

6.1.3. Controle das taxas de erro.


A pergunta qual taxa de erro se deve controlar em um problema de comparaes
mltiplas tem gerado muita discusso na literatura.
O enfoque do controle da taxa de erro envolve uma considerao cuidadosa da
natureza e da finalidade da pesquisa. Os erros do tipo I so preocupantes em uma pesquisa,
quando uma seleo eficaz de falsos positivos necessria. Se esta premissa no for
estritamente verdadeira, ento os erros do tipo II (perder diferenas verdadeiras) podem ser
mais preocupantes.
As medidas probabilsticas de erros do tipo I so mais freqentemente escolhidas,
porque so mais fceis de analisar e controlar. A probabilidade de erros do tipo II
reduzida, quando se permite probabilidade mais elevada de erros do tipo I (Em geral,
emprega-se uma aproximao terica de deciso que considera os custos relativos dos
erros do tipo I e do tipo II). Pode-se tambm delinear o experimento com o objetivo de
controlar a probabilidade de erro do tipo II.
Em resumo, a taxa particular de erro a ser controlada deve ser determinada por
detalhada considerao da natureza do estudo e de sua importncia no plano geral da
pesquisa. Em situaes de anlise de dados de complexidade variada, difcil justificar a
escolha de uma nica taxa de erro para todas as situaes.

6.1.4. Testes de mdias protegidos e no-protegidos


Expondo de maneira grandemente simplificada, na aplicao de um teste de
comparao mltipla, podem-se considerar dois caminhos: a) Testar diretamente todas as
possveis comparaes entre os m tratamentos dois-a-dois (C2m ) ; ou b) Testar todas as
possveis comparaes, aps ter sido verificado que o teste F foi significativo (alguns
testes envolvem apenas o erro por comparao). Como o teste F avalia a probabilidade
de todas as comparaes simultaneamente, controla-se o erro em nvel de experimento,
ou seja, de todas as famlias de hipteses envolvidas no experimento. Ento, no caso b
temos o teste dito protegido, quando aplicamos previamente o teste F; e no caso a, o
teste no-protegido, quando aplicamos o teste de comparao mltipla sem previamente
termos verificado a signficncia do teste F.

23

7. REGRESSO LINEAR
7.1.

Introduo

Nos captulos anteriores, analisamos apenas a caracterstica da planta como


produo, ou germinao, ou peso da matria seca, etc. e as diferenas impostas pelos
tratamentos nessas caractersticas.
No presente caso, vamos estudar melhor a dependncia da caracterstica da planta,
como a produo, para com os tratamentos. Se chamarmos a produo de Y e os
tratamentos de X (tratamentos neste caso so valores quantitativos), essa dependncia da
varivel Y para com outra varivel X recebe o nome de funo.
Em Estatstica, esta dependncia chamada de Regresso.
Alm disso, o Y chamado de varivel dependente e o X de varivel independente.
Numa regresso linear, temos:
ab X
Y
y. x
O b y.x a declividade da reta e implica na variao de Y quando X varia em uma
unidade.
O b y.x lido como o coeficiente da regresso linear de Y sobre X.
Nesse caso, o valor desse coeficiente estimado por b y.x

7.2.

SPXY Cov(X, Y)

.
SQ X
VarX

Usos da regresso ( ou Objetivos)

a) Verificar se Y depende de X.
b) Predio de Y atravs de X.
c) Determinar a forma da curva.
d) Ajuste da anlise de Y, em um experimento, depois de retirados os efeitos de uma
varivel X (covarincia).

8.

CORRELAO

O coeficiente de correlao outra medida do relacionamento mtuo entre duas


variveis. A figura abaixo mostra as alturas de 11 irmos e respectivas irms. Como no h
razo de se pensar que uma altura a varivel dependente e a outra a varivel
independente, as alturas so denominadas, X1 e X2, ao invs de Y e X.

24

Podemos imaginar ento que temos possibilidade de ajustar a equao


X2 a b x1.x 2 X1 ou a equao X1 a b x 2.x1X2 . Para no permanecermos na dvida,
podemos tomar a mdia geomtrica dos dois coeficientes de regresso e obtemos.
Cov(X1 , X 2 ) Cov(X1 , X 2 )
rX1X 2 b x 2.x1 . b x1.x 2
, ento,
VarX 1
VarX 2

(X1 X1 )(X 2 X 2 )

rX1X 2

( X1 ) 2
( X 2 ) 2
( X
)( X 2
)
n
n
O valor de r, que o coeficiente de correlao da amostra.
2
1

De maneira grosseira, podemos dizer que r a expresso quantitativa das


similaridades comumente observadas entre filhos dos mesmos pais - a tendncia de irms
altas terem irmos altos.

9.

REGRESSO LINEAR MLTIPLA

Muitas vezes a regresso de Y sobre uma nica varivel independente


inadequada. Duas ou mais variveis independentes podem fornecer informaes adicionais
acerca de Y, por meio da regresso mltipla sobre os diversos X.
A forma geral de uma regresso mltipla a seguinte:
Y = b0 + b1X1 + b2X2 + b3X3 + ... + bkXk,
em que
Y a produo estimada,
bi, i = 0, 1, ... , k, so os coeficientes de regresso
Xi, i = 1, ... , k, so as variveis independentes.
Como vimos, o modelo bsico de regresso linear
Y = b0 + b1X + e,
em que as estimativas de b0 e b1 so dadas pelas equaes normais
nb 0 b1 X i Yi

b 0 X i b1 X 2i X i Yi

Estendendo o modelo para mais de uma varivel independente, teremos o seguinte


exemplo:
A venda Y de um determinado produto depende de:
X1 = quantidade de dlares empregados na propaganda por meio do rdio.
X2 = quantidade de dlares empregados na propaganda nos jornais.
Portanto,
Yi = b0 + b1X1i + b2X2i + ei.
Os coeficiente da populao 0, 1 e 2 devem ser estimados de modo que
e 2 ( Y b 0 b 1 X1 b 2 X 2 ) 2
seja mnima.

25

As equaes normais obtidas sero:


nb 0 b1 X1 b 2 X 2 Y

b 0 X1 b1 X12 b 2 X1 X 2 X1Y

b 0 X 2 b 1 X1 X 2 b 2 X 2 X 2 Y
2

Resolvendo esse sistema de equaes lineares, teremos b0, b1 e b2, que so as


estimativa de 0, 1 e 2.
Quando o nmero de variveis independente igual a k, teremos:
Y = b0 + b1X1 + b2X2 + b3X3 + ... + bkXk.
As equaes normais sero:
nb 0 b1 X1 b 2 X 2 ... b k X k Y

b 0 X1 b1 X12 b 2 X1 X 2 ... b k X1 X k X1Y


.
.
.
.
.
.
.
.
.
2
b 0 X k b1 X1 X k b 2 X 2 X k ... b k X k X k Y

cujas solues sero as estimativas b0, b1, ... , bk.


A soma de quadrados dos desvios da regresso ser sempre
SQD e 2 (Y Y) 2 ,
corresponde aos valores estimados por
em que Y corresponde aos valores observados e Y
meio da equao obtida.
Consequentemente, podemos ter a seguinte anlise de varincia:
Fonte de variao
Regresso
Desvio da regresso
Total

gl
k
n-k-1
n-1

SQ
SQR
SQD
SQTO

QM
QMR
QMD

O teste F, nesse caso, obtido pela diviso QMR/QMD, verifica a hiptese nula
H0: 1 = 2 = 3 = ... = k = 0
contra a hiptese alternativa
Ha: i 0, i = 1, 2, ... , k.
Para verificar se alguma varivel contribui significativamente para o modelo de
regresso, procede-se da seguinte maneira:
1) Ajustar o modelo de regresso completo, C, isto , ajustar o modelo com todas as
variveis de interesse, e calcular a Soma de Quadrados dos Desvios, SQDC.
2) Ajustar o modelo de regresso reduzido, R, isto , ajustar o modelo sem as variveis que
se deseja testar, e calcular a Soma de Quadrados dos Desvios, SQDR.
3) Aplicar o seguinte teste F:

26

(SQD R SQD C )
(gld R gld C )
F
,
SQD C
gld C
em que gldR e gldC so os graus de liberdade associados s somas de quadrados dos desvios
dos modelos R e C, respectivamente.
O F assim obtido comparado com o valor tabelado, com os graus de liberdade
{(gldR - gldC), gldC)} e o nvel de significncia desejado.

10. REGRESSES POLINOMIAIS


As regresses polinomiais podem, em alguns casos, ser bons substitutos das
regresses no-lineares. Como exemplo de regresso polinomial, veremos o caso da
regresso quadrtica, cujo modelo
Y = a + bX + cX2 + e.
A obteno das estimativas a, b e c feita minimizando-se a soma de quadrados
dos desvios, de maneira anloga regresso linear vista anteriormente (tambm aplicvel a
outros tipos de regresso).
Ento, a seguinte expresso minimizada:
2
2 2
e (Y a bX cX ) .
Para tanto, tomamos as derivadas parciais em relao a a, b e c e as igualamos a

zero:
2
0
a
2
0
b
2
0
c
Resolvendo esse sistema de trs equaes e trs incgnitas, que so as equaes
normais da regresso quadrtica, obtemos as estimativas a, b e c.

Obtida a equao de regresso, podemos calcular os valores esperados Y .


Lembrando que

e i Y Y , podemos calcular a SQE.


A anlise de varincia ser:
F.V.
Regresso quadrtica
Desvio da regresso
Total

G.L.
2
n-3
n-1

SQ
SQR
SQE
SQTO

QM
QMR
QME

O teste F nos dir se b e/ou c so diferentes de zero ou no.


Para verificarmos se a equao quadrtica, e no simplesmente linear,
procedemos seguinte anlise, ajustando as regresses linear e quadrtica e usando os
dados de ambas as anlises de varincias:

27

F.V.
Regresso
Desvio
Total

Regresso linear
G.L.
SQ
1
SQRL
n-2
SQEL
n-1
SQTO

Regresso quadrtica
G.L.
SQ
2
SQRQ
n-3
SQEQ
n-1
SQTO

Para verificar se a regresso quadrtica, usa-se o teste F.


[SQEL SQEQ ] [(n 2) (n 3)]
, com [(n-2)-(n-3)] e (n-3) graus de
F
SQEQ (n 3)
liberdade.
Se o componente quadrtico no for significativo, a regresso ser linear (se esta
tiver sido significativa).
Se o componente quadrtico for significativo, a regresso ser quadrtica. Neste
caso, deve-se incluir sempre o componente linear no modelo, independentemente de o
componente linear ser significativo ou no.
Esse mesmo procedimento pode ser usado para o ajuste de equaes cbicas,
qurticas, etc.

28

11. CURVAS DE CRESCIMENTO


11.1. Curvas de crescimento exponencial
Os organismos mais simples iniciam seu crescimento pela diviso binria de suas
clulas.
Considere o crescimento de uma colnia de bactrias mantida sob condies
nutricionais e ambientais constantes, de tal forma que haja uma taxa constante de diviso
celular. Assuma, tambm, que as clulas se dividam de maneira sincronizada, isto , todas
as clulas na colnia se dividem simultaneamente (algumas espcies de microrganismos
tm esse comportamento).
Se o nmero inicial de clulas na colnia n0, e n o nmero de clulas aps um
dado nmero de divises, ento,
ao final da primeira gerao
n = n0 . 2
segunda

n = n0 . 2 . 2
x-sima

n = n0 . 2x
Essa ltima relao indica que o nmero de clulas numa colnia est crescendo
numa progresso geomtrica ou exponencialmente, isto , em uma taxa sempre
crescente.
Podemos reescrever a equao n = n0 . 2x da seguinte forma:
log n = log n0 + x log 2.
Essa equao expressa a relao entre o nmero de clulas na colnia, n, e o
nmero de geraes ocorridas, x, porm, normalmente, desejvel obter-se a relao entre
n e o tempo t. Portanto, se t o tempo em que x geraes ocorrem e o tempo para uma
gerao g, ento:
x = t/g.
Substituindo essa varivel na equao acima, temos:
log n = log n0 + (t/g) log 2.
Considerando constante o tempo de uma gerao, (log 2)/g ser, tambm, constante
e poder ser representado por k.
Portanto, pode-se escrever
log n = log n0 + kt
que uma equao linear da forma y = a + bx, em que log n0 est representado por a e k
por b.
A taxa de crescimento de uma colnia com esse tipo de crescimento dada pelo
incremento, dn, do nmero de clulas em um curto intervalo de tempo, dt; ou seja,
podemos dizer que a taxa de crescimento igual a dn/dt.
O valor dn/dt representa a declividade da curva em um dado tempo t e pode ser
observado que, no caso do crescimento exponencial, essa declividade aumenta
progressivamente com o tempo. Se todas as clulas estiverem se dividindo mesma taxa r,
claramente, a qualquer tempo t, a taxa de crescimento da colnia ser proporcional ao
nmero de clulas presente, isto , dn/dt ser proporcional a n.
Assim, apesar de a taxa de diviso celular, r, permanecer constante, a taxa absoluta
de crescimento da colnia como um todo no constante, pois com o correr do tempo, o
nmero de clulas presentes na colnia aumenta. O valor de r dado por dn/dt (o

29

incremento no nmero de clulas na colnia em um curto intervalo de tempo), dividido


pelo nmero de clulas em reproduo, isto ,
dn 1
r=

dt n
Esse valor conhecido como a taxa de crescimento relativo da colnia. Assim, para
uma colnia mostrando esse tipo de crescimento, a taxa de crescimento absoluto aumenta
com o tempo, porm a taxa de crescimento relativo permanece constante.
Observe que a equao log n = log n0+ kt pode ser destransformada (antilogaritmo)
em: n = n0ekt, em que e a base do logaritmo natural (nmero neperiano = 2,7182).
Generalizando esse tipo de crescimento, com x denotando o tempo e f o tamanho,
tem-se o crescimento exponencial da seguinte forma:
df
kf , ou f(x) = e k ( x ) .
dx
Assim, a taxa de crescimento proporcional ao tamanho corrente f, sendo que para
k > 0, o crescimento ilimitado. O crescimento exponencial para x pequeno uma
caracterstica de muitos modelos de crescimento.
O modelo potncia-de-tempo,
f(x)= x
, algumas vezes, til. Porm, tanto no caso do modelo potncia-de-tempo, quanto no
modelo exponencial, o crescimento ilimitado, enquanto que o crescimento biolgico,
quase que invariavelmente, estabiliza com o tempo, tal que o tamanho final
lim f ( x )
x

existe e finito.
df
0 , quando x .
dx
Talvez, a pressuposio mais simples do crescimento limitado a de que a taxa de
crescimento proporcional ao tamanho restante, isto ,
df
k ( f ) ,
dx
para algum k > 0. A soluo geral dessa ltima expresso pode ser parametrizada como:
f (x) ( )e kx ,
em que x > 0 e k > 0.
Se a curva tem por objetivo descrever o crescimento (isto , aumento), necessita-se
> > 0. Com essa parametrizao, o tamanho final, [= f(0)] o tamanho inicial e k
atua como um parmetro de escala de x, governando, assim, a taxa de crescimento. Uma
parametrizao mais comum dada por

Como resultado,

f(x) = e kx
com substituindo - .
Pode-se, tambm, escrever
f (x) (1 e k ( x ) ) .
Esse modelo usualmente denominado de modelo de crescimento
monomolecular
Substituindo, ainda, - por - e e-k por , em que 0 < < 1, obtemos:
f (x) x , 0 < < 1 ,

30

que denominado modelo de regresso assinttica. Em estudos de resposta de aplicao de


fertilizantes, esta equao denominada Lei de Mitscherlich.
Outro exemplo que pode ser de interesse o do crescimento exponencial
relacionado fotossntese.
Se P o peso da matria seca do aparato fotossinttico de uma planta, com seu
sistema de suporte completo, representado por razes, caules e ramos; R a taxa de
fotossntese expressa como a proporo de P em unidade de tempo; e se a proporo
dos produtos da fotossntese reinvestida na produo de mais P, ento a taxa de incremento
do total do aparato fotossinttico, dP/dt, RP. Como em todos os casos em que a taxa de
formao de uma substncia proporcional quantidade j presente, o resultado um
incremento exponencial (isto , logartmico) tpico de P. Assim, por integrao, obtm-se a
expresso
P = P0eRt
em que P0 o tamanho do aparato fotossinttico quando as observaes iniciaram, ou seja,
t = 0. Alm disso, qualquer incremento em matria seca em razo da fotossntese
particionada entre a formao de novo P e a formao de material armazenado S (nos
tubrculos, por exemplo). Segue-se que a razo de S em relao ao acrscimo em P igual
razo de 1 para , ou seja:
S
(1 )
,

(P P0 )

ou seja, o peso total da planta ser


P + S = P + (P P0) [(1 )/]
1
(1 )
PS P
P0

que, substituindo P por P0eRt nessa equao, obtm-se


1
(1 )
P S P0e Rt
P0 .

Pela anlise dessa equao, pode-se verificar que o crescimento total de uma planta
(P + S) depende quase igualmente da taxa de fotossntese, R, e da proporo dos produtos
fotossintticos dedicados a produzir novas partes fotossinteticamente teis da planta, ,
pois a taxa de juros compostos, que determina a taxa de crescimento, no depende de R
porm do produto de R com . Na ausncia de um rgo especializado de armazenamento
(por exemplo, plantas no estdio vegetativo), o reinvestimento fornece um dreno para os
produtos fotossintetizados e, isso ocorrendo, pode aumentar R.

11.2. Modelos de crescimento sigmoidal


Em muitos tipos de crescimento, a taxa de crescimento no diminui de modo
constante. Ao invs disso, a taxa cresce por determinado perodo, atinge um mximo e
depois decresce de modo consistente at tornar-se zero. Esse comportamento toma, em um
grfico, a forma de um S ou sigmide.
Nessa curva, um ponto a ser notado o de inflexo, que o tempo de mxima taxa
de crescimento (ponto que chamaremos de wM).
Os modelos sigmoidais so produzidos pela modelagem da taxa de crescimento
corrente como o produto das funes do tamanho corrente e o crescimento remanescente.
df
g(f )[h () h (f )] , ( leia-se proporcional a)
dx

31

em que g e h so funes crescentes com g(0) = h(0) = 0. Muitas das curvas de crescimento
so monomoleculares pela simples transformao do tamanho f (Curva de Richards) ou do
tempo x (Modelo de Weibull).

11.2.1. Modelo logstico (autocataltico)


A forma mais simples da equao anterior com g(f) = h(f) = f, tal que
df k
f ( f )
dx
em que k > 0 e 0 < f < .
A equao logstica foi derivada de forma puramente emprica por Verhulst, em
1838, para descrever o crescimento em tamanho de uma populao ou de um rgo.
Entretanto, a equao tambm descreve a taxa de consumo de uma substncia qumica
monomolecular que se degrada em uma reao autocataltica e houve sugestes de
Robertson (1908) de que a natureza bioqumica do processo de crescimento era semelhante
a isso.
k
A expresso
a constante de proporcionalidade, tal que os parmetros so

separadamente interpretveis. Assim, de (24.9), a taxa relativa de crescimento decresce


linearmente em f at f aproximar-se de . A equao 24.9 tem uma soluo geral que pode
ser escrita da seguinte maneira:

, - < x < ,
f (x)
1 e k ( x )
denominado de modelo logstico.
A curva tem assntotas f = 0 para x - e f = para x , que so, obviamente,
jamais atingidas. Isso causa pouca dificuldade na prtica, pois, quando se iniciam as
coletas dos dados, tem-se f > 0. Percebe-se que a taxa de crescimento atinge o mximo

quando f , que ocorre quando x = .


2
Assim, se > 0, o ponto de inflexo de f(x) visvel. A taxa mxima de
k
crescimento wM =
, e a taxa de crescimento agora simtrica em x = , levando a
4
uma curva de crescimento sigmoidal simtrica. Novamente, k atua como um parmetro de

escala de x, influenciando a taxa de crescimento. O tamanho inicial f (0)


.
(1 e k )
Uma parametrizao comum :

f (x)
,
1 e kx
em que e kx , na equao (10).
Entretanto, uma das formas mais conhecidas da equao logstica
f(x) =

exp( x )
em que f(x) a probabilidade de uma resposta a
1 exp( x )

uma quantidade x de uma droga ou de tempo.


Essa equao pode ser transformada em

32

f(x) =

1
, obtida pela diviso do numerador e do
1 exp[ ( x )]

denominador por exp(+x).

11.2.2. Curvas de crescimento de Gompertz, de von Bertalanffy, de


Richards, de Weibull e outras.
(Lembrar da existncia dessas curvas).

12. AJUSTE DE REGRESSES NO-LINEARES


12.1. Um mtodo geral de ajuste
Suponha que a relao populacional entre Y e X seja da forma
Yi = f(, , , Xi) + i
(i = 1, 2, ... n)
em que f uma funo de regresso contendo Xi e os parmetros , e . (Poder haver
mais de uma varivel X). Se o resduo i tem mdia zero e varincia constante, o mtodo
dos quadrados mnimos de ajuste de regresses estima os parmetros , e pela
minimizao de
n

[Yi

i 1

f (, , , X i )]2

O primeiro passo no mtodo geral obter boas estimativas iniciais, a 1, b1, c1, das
, , . Para os tipos comuns de funes no-lineares, vrias tcnicas
estimativas finais
tm sido desenvolvidas, algumas delas grficas, outras por estudos especiais do problema.
O segundo passo usar o teorema de Taylor. Esse teorema enuncia que, se f(, , ,
X) contnua em , e e se ( a1), ( b1) e ( c1) so pequenas,
f(, , , Xi) f(a1, b1, c1, Xi) +( a1)fa +( - b1)fb + ( - c1)fc
em que fa, fb e fc denotam as derivadas parciais de f com respeito a , e ,
respectivamente avaliadas nos pontos a 1, b1, e c1.
Por exemplo, na regresso assinttica
f(, , , Xi) = (Xi)
temos
X 1
fa = 1;
fb = c1Xi ;
fc = b1X i (c1 i ) .
Como a1, b1 e c1 so conhecidos, os valores de f, fa, fb, e fc podem ser calculados
para cada membro da amostra, em que escrevemos f no lugar de f(a1, b1, c1, Xi).
Do teorema de Taylor, a relao de regresso original
Yi = f(, , , Xi) + i
pode ser escrita, aproximadamente, como:
Yi f + ( a1)fa + ( b1)fb + ( c1)fc + i .
(12.1)
Agora, escrevemos:
Yres = Y f;
X1 = fa;
X2 = fb;
X3 = fc.
Da equao (12.1),
Yres ( a1)X1 + ( b1)X2 + ( c1)X3 + i
(12.2)
A varivel Yres o resduo de Y da primeira aproximao. A relao (12.2)
representa uma equao linear ordinria de Yres sobre as variveis X1, X2 e X3, com os
coeficientes de regresso ( a1), ( b1) e ( c1).
33

Se a relao 12.2 fosse exata ao invs de aproximada, a computao da regresso


a1 ) ,
da amostra de Yres sobre X1, X2 e X3 forneceria os coeficientes de regresso (

( b1 ) e ( c1 ) , dos quais as estimativas corretas de , e poderiam ser


imediatamente obtidas.
Como a relao (12.2) aproximada, o ajuste dessa regresso produz segundas

, e , respectivamente. Ento recalculamos f, fa, fb, e fc


aproximaes a2, b2 e c2 de
nos pontos a2, b2 e c2, encontrando um novo Yres e novas variveis X1, X2 e X3. A regresso
da amostra desse Yres sobre X1, X2 e X3 fornece os coeficientes de regresso (a 3 a2), (b3

, e encontrada, e
b2) e (c3 c2) dos quais uma terceira aproximao a 3, b3 e c3 de
assim por diante.
2
Se o processo efetivo, a soma de quadrados dos resduos, Yres , deveria
decrescer consistentemente em qualquer estdio, com o decrscimo tornando-se menor
com a aproximao da soluo de mnimos quadrados. Na prtica, os clculos so
2
paralisados quando o decrscimo em Yres e as mudanas em a, b e c so consideradas
pequenas o bastante para serem negligenciadas. O quadrado mdio do resduo
s 2 Yres2 /(n k) ,
em que k o nmero de parmetros estimados (no exemplo k = 3). Em regresses nolineares, s2 no um estimador no-viesado de 2 , apesar de que ele tende a ser noviesado para n grande.
, e so obtidos pelo processo
Erros padres aproximados das estimativas
usual, pelos multiplicadores de Gauss na regresso mltipla final computada. Assim,
s( ) s c11 ; s( ) s c 22 ; e s( ) s c33 .

ts c11 em que t tem (n


Limites de confiana aproximados para so dados por
k) gl.

13. ESTIMAO EM FATORIAIS NO BALANCEADOS


Num fatorial envolvendo dois fatores, no delineamento inteiramente casualizado, o
modelo :
yijk = + i + j + ij + ijk
em que
yijk
o k-simo dado da clula (i,j).
i
o efeito do i-simo nvel do fator A.
j
o efeito do j-simo nvel do fator B.
ij
o efeito da interao do i-simo nvel do fator A e o j-simo nvel do fator
B.
ijk
o erro aleatrio associado a cada observao.
Faa ij denotar o nmero de observaes na clula do nvel i de A e nvel j de B.
Se ij denota a mdia populacional da clula do nvel i de A e j de B, ento, ij = + i + j
+ ij .
As frmulas computacionais do procedimento ANOVA do SAS, que usa as vrias
mdias de tratamentos, fornece as estatsticas corretas no caso de dados balanceados,

34

isto , dados com nmeros iguais de observaes (ij = para todo i, j), para cada
combinao de tratamento.
Quando os dados no so balanceados, as somas de quadrados computadas pelo
procedimento ANOVA pode conter funes dos outros parmetros do modelo e,
conseqentemente, produzir resultados viesados.
Para ilustrar o efeito de dados no-balanceados na estimao de diferenas entre
mdias e na computao das somas de quadrados, consideremos os dados na seguinte
tabela de duas entradas:
B
1

1
7

2
5

A
4

Dentro do nvel 1 de B, a mdia da clula para cada nvel de A 8; isto ,


y11. (7 9) / 2 8 e y 21. 8 . Ento, no h evidncia de diferena entre os nveis de A
dentro do nvel 1 de B. Semelhantemente, no h evidncia de diferena entre os nveis de
A no nvel 2 de B, porque y12. 5 e y 22. (4 6) / 2 5 . Portanto, poder-se-ia concluir
que, na tabela, no h evidncia de diferena entre os nveis de A. Entretanto, as mdias
marginais de A so:
y1.. (7 9 5) / 3 7 e
y 2.. (8 4 6) / 3 6 .
A diferena de 7 6 = 1 entre essas mdias marginais pode ser erroneamente
interpretada como medindo um efeito geral do fator A. Na realidade, as diferenas
observadas entre as mdias marginais dos dois nveis de A mede o efeito do fator B em
acrscimo ao efeito do fator A. Isso pode ser verificado expressando-se as observaes em
termos do modelo da anlise de varincia yijk = + i + j . (Para simplificar, o termo da
interao foi deixada fora do modelo).

1
7 = + 1 + 1
9 = + 1 + 1

8 = + 2 + 1

B
2
5 = + 1 + 2

A
4 = + 2 + 2
6 = + 2 + 2

A diferena entre as mdias marginais de A1 e A2 seria a seguinte:


y1.. y 2.. (1 / 3)[(1 1 ) (1 1 ) (1 2 )]
(1 / 3)[(2 1 ) (2 2 ) (2 2 )]
(1 2 ) (1 / 3)(1 2 ) .
Assim, ao invs de estimar (1 2), a diferena entre as mdias marginais de A
estima (1 2) mais uma funo dos parmetros do fator B, (1 2)/3. Em outras
palavras, a diferena entre as mdias marginais de A so viesadas pelos efeitos do fator B.
A hiptese nula acerca de A normalmente testada :
H0: 1 2 = 0.
35

Entretanto, no presente exemplo, a soma de quadrados de A, computada pelo


procedimento ANOVA, pode ser mostrada como sendo igual a 3( y1.. y 2.. ) 2 / 2 . Ento, o
teste F do procedimento ANOVA para A na realidade testa a hiptese
H0: (1 2) + (1 2)/3 = 0,
que envolve a diferena (1 2) do fator B, em acrscimo diferena (1 2) do fator A.
Em termos do modelo yijk = ij + ijk , geralmente se deseja estimar (11 + 12)/2 e
(21 + 22)/2 ou a diferena entre essas quantidades. Entretanto, as mdias marginais de A
do exemplo so:
y1.. (211 12 ) / 3 1.. e
y 2.. ( 21 2 22 ) / 3 2.. .
Essas mdias estimam (211 + 22)/3 e (21 + 222)/3, que so funes das
freqncias das clulas e podem no ter significado.
Resumindo, o maior problema na anlise de dados no-balanceados a
contaminao das diferenas entre as mdias dos fatores pelos efeitos dos outros fatores. A
soluo para esse problema ajustar convenientemente as mdias de modo a remover os
efeitos contaminantes.

14. COMPARAO DE MDIAS MULTIVARIADAS


14.1. Observaes repetidas no tempo ou no espao - Anlise de perfil

Resposta mdia

A anlise de perfil se aplica a situaes em que uma srie de tratamentos


administrada a dois ou mais grupos de parcelas. Assume-se que as respostas dos diferentes
grupos so independentes entre si, porm todas as respostas devem ser expressas em
unidades semelhantes. Ordinariamente, pode-se formular a seguinte questo: Os vetores
de mdias das populaes so iguais? Na anlise de perfil, a questo de igualdade dos
vetores de mdias dividida em vrias possibilidades especficas.
Consideremos as mdias da populao 1, 1 ' 11, 12 , 13, 14 , que representam
as respostas mdias do primeiro grupo a quatro tratamentos. Um grfico dessas mdias
ligadas por linhas retas mostrado na Figura 14.1. Esse grfico de linha quebrada o
perfil da populao 1.

Figura 14.1. Perfil da populao 1 (p = 4)

Os perfis podem ser1construdos


2 para cada
3 populao
4 (grupo). Vejamos o caso de
dois grupos.
Tratamento (p = 4)
36

Consideremos uma segunda populao, cujo vetor das respostas mdias aos
mesmos quatro tratamentos aplicados na populao 1 2 ' 21, 22 , 23, 24 . A
hiptese H0: 1 2 implica que os tratamentos tm o mesmo efeito (mesmas mdias) nas
duas populaes. Em termos de perfis populacionais, podemos formular a questo de
igualdade por etapas.
1. Os perfis so paralelos?
Equivalentemente: H01: 1i 1i 1 2i 2i 1 , i = 2, 3, . . . , p, aceitvel?
2. Assumindo que os perfis so paralelos, so eles coincidentes?
Equivalentemente: H02: 1i 2i , i = 2, 3, . . . , p, aceitvel?
3. Assumindo que os perfis so coincidentes, so eles nivelados (horizontais)? Isto ,
todas as mdias so iguais a uma mesma constante?
Equivalentemente: H03: 11 12 1p 21 22 2p aceitvel?
Teste para verificar se os perfis de duas populaes normais so paralelos
A hiptese nula no estgio 1 pode ser escrita
H01: C1 C 2
em que C a matriz contraste
1 0 0 0
1
0 1 1 0 0
C

(( p 1) xp )

0 0 0 0 1
0

0
0

(14.1)

Para amostras independentes de tamanho n 1 e n2, retiradas das duas populaes, a


hiptese nula pode ser testada construindo-se as observaes transformadas
j = 1, 2, . . . , n1 e
Cx1 j ,
j = 1, 2, . . . , n2.

Cx 2 j ,

Essas observaes transformadas tm vetores de mdias Cx1 e Cx 2 ,


respectivamente, e matriz de covarincia combinada, CScombC.
Como os dois conjuntos de observaes transformadas tm distribuio
N p 1 (C1, CC' ) e N p 1 (C 2 , CC' ) , respectivamente, pode-se aplicar um teste para
verificar se os perfis so paralelos.
Rejeitar H01: C1 C 2 (perfis paralelos) no nvel se
1

1
CScomb C' C( x1 x 2 ) c 2
T ( x1 x 2 )' C'
n1 n 2

em que

(n1 n 2 2)(p 1)
Fp 1, n1 n 2 p ,()
n1 n 2 p
Quando os perfis so paralelos, o primeiro estar acima do segundo, 1i 2i , para
todo i, ou vice-versa. Sob essa condio, os perfis sero coincidentes apenas se os totais
das alturas, 11 12 1p 1' 1 e 21 22 2p 1' 2 , forem iguais.
c2

Teste de coincidncia de perfis, dado que os perfis so paralelos

37

A hiptese nula do estgio 2 pode ser expressa em forma equivalente:


H02: 1' 1 1' 2
Podemos testar H02 com a estatstica t da comparao de duas amostras, com base
nas observaes multivariadas 1' x1 j , j = 1, 2, . . ., n1 e 1' x 2 j , j = 1, 2, . . ., n2.
Para duas populaes normais: Rejeitar H02: 1' 1 1' 2 (perfis coincidentes) no
nvel se
1

1
1' Scomb 1 1' ( x1 x 2 )
T 1' ( x1 x 2 )
n1 n 2

1' (x1 x 2 )
F1, n1 n2 2, ( )
t2

n1 n 2 2

1 1
2
1Scomb1
n1 n 2

Para perfis coincidentes, x11, x12 , , x1n1 e x 21, x 22 , , x 2n 2 so observaes da


mesma populao normal.
Teste para perfis planos, dado que os perfis so coincidentes
O passo seguinte verificar se todas as variveis tm a mesma mdia, tal que o
perfil comum seja plano (ou uma reta horizontal).
A hiptese nula no estgio 3 pode ser escrita
H03: C(1 + 2) = 0
em que C dado pela Equao 14.1. Quando H01 e H02 so aceitveis, o vetor de mdias
comum estimado por
n1

n2

x1 j x 2 j

n1
n2

n1 n 2
( n1 n 2 ) x1 ( n 1 n 2 ) x 2
Consequentemente, temos o seguinte teste:
Para duas populaes normais: Rejeitar H03: C(1 + 2) = 0 (perfis planos) no nvel
x

se

j 1

j 1

(n1 n 2 )x' C' CScomb C'1 Cx Fp 1, n1 n 2 p, ()

==================
Quando os tamanhos das amostras so pequenos, a anlise de perfil depender da
pressuposio de normalidade. Essa pressuposio pode ser conferida com os mtodos
disponveis, usando-se as observaes originais, xj, ou as observaes contrastes, Cxj. A
anlise de perfil para vrias populaes acompanha o mesmo mtodo de duas populaes.

15. ESTATSTICA NO PARAMTRICA


Os testes no paramtricos so utilizados na maioria dos campos de investigao,
existindo mesmo situaes em que prefervel a utilizao de testes no paramtricos no
38

lugar dos testes paramtricos. Para optarmos pela aplicao de um determinado teste
estatstico devemos ter ateno:
No objetivo do teste;
Quantas variveis temos e de que tipo so;
Qual a dimenso da amostra;
Como as variveis se distribuem.

15.1. Principais diferenas entre Testes Paramtricos e Testes No


Paramtricos
Testes Paramtricos:
A distribuio da populao conhecida priori;
Especificam condies sobre os parmetros da populao;
Testam-se parmetros em nmeros finitos;
Os dados so medidos, normalmente, em escala de intervalo;
Trabalham diretamente com as observaes recolhidas;
So mais potentes desde que sejam satisfeitas as suposies associadas aos
testes paramtricos;
Testes No Paramtricos:
No necessrio o conhecimento da distribuio da populao;
Especifica condies, mas em menor nmero do que os testes paramtricos;
Os dados so, geralmente, medidos numa escala ordinal, embora em alguns
casos numa escala nominal;
Trabalham com a ordem das observaes;
So testes freqentemente utilizados no caso de pequenas amostras;

15.2. Vantagens e Desvantagens dos Testes No Paramtricos


A aplicao de testes no paramtricos no exige requisitos to fortes, como a
aplicao de testes paramtricos. So teis em situaes em que as amostras so pequenas
ou no se verificam os pressupostos associadas aos testes paramtricos.
Os testes paramtricos so mais potentes para uma pequena dimenso da amostra e
um mesmo , ou seja, conduzem com maior freqncia rejeio de hiptese nula quando
ela , de fato, falsa.

15.3. O Caso de uma Amostra


Um tipo de teste no paramtrico de uma amostra o teste de aderncia. Extrai-se
uma amostra aleatria e comprova-se a hiptese de que a amostra tenha sido extrada de
uma populao com uma distribuio especificada. Poderemos, ento, responder s
seguintes perguntas:
H diferenas significativas entre as freqncias observadas e as freqncias que
deveramos esperar?
H diferenas significativas entre as propores observadas e as propores
esperadas?
razovel admitir que a amostra seja uma amostra aleatria de alguma populao
conhecida?
39

15.3.1. Teste de 2 no teste de aderncia de uma amostra


Algumas vezes, deseja-se conhecer a forma da distribuio dos dados e no os
parmetros de distribuio. Em outras palavras: deseja-se testar a hiptese de que os dados
da amostra vieram de uma determinada distribuio.
O teste 2 deve ser empregado quando os dados se dispem em categorias discretas
e quando as freqncias esperadas so suficientemente grandes.
Na hiptese nula, pode-se testar a igualdade das propores entre todas as
categorias da varivel de nvel nominal (distribuio uniforme), ou pode-se testar outras
propores especificadas a priori.
As hipteses so as seguintes:
H0 : A amostra segue uma distribuio especificada.
Ha : A amostra no segue essa distribuio especificada.
A estatstica do teste dada por:
k (O E ) 2
i
2 i
E
i 1
i
em que
Oi = nmero de casos observados classificados na categoria i
Ei = nmero de casos esperados na categoria i sob H0
K = nmero de categorias na classificao
N
Ei
K

15.3.2. Teste de Kolmogorov-Smirnov


O Teste de Kolmogorov-Smirnov um teste de aderncia, desenvolvido por
Kolmogorov (1933), para testar a hiptese de uma distribuio contnua, com parmetros
especificados, isto , verifica se os valores da amostra podem ser considerados como
provenientes de uma populao, com uma determinada distribuio terica. O teste procura
descrever a distribuio de freqncia acumulada, que ocorreria sob a distribuio terica
(o que se poderia esperar sob H0), e a compara com a distribuio de freqncia acumulada
observada. O teste aplicado a duas amostras foi desenvolvido por Smirnov (1939),
resultando no nome atual do teste.
A opo por este teste tem subjacente a suposio de que a varivel em estudo
tenha distribuio contnua. Nos casos em que aplicvel, este teste o mais poderoso dos
testes de aderncia.
Pretende-se observar o "grau de concordncia" entre a funo de distribuio
terica (F0(.)), especificada na hiptese nula, e a distribuio de freqncias relativas
acumuladas observadas de valores amostrais (Sn(.)). Considera-se o ponto em que as duas
distribuies acusam maior divergncia, sendo, ento, a estatstica do teste:
D=mx| F0(x)-Sn(x) |.

15.3.3. Teste de Iteraes ou de Aleatoriedade


usado no caso de pretendermos inferir sobre determinada populao, atravs das
informaes proporcionadas por uma amostra da mesma, que dever ser aleatria.
O mtodo baseia-se no nmero de iteraes que uma amostra apresenta. Uma
iterao definida como uma seqncia de smbolos idnticos que aparecem seguidos e
precedidos por smbolos diferentes, ou por nenhum smbolo.
40

Suponhamos o seguinte caso: Dada uma srie de sinais "mais" e "menos" na


seguinte ordem :
++---+----++ - +
Nmero de iteraes (runs) = r = 7
O nmero total de iteraes em uma amostra de qualquer dimenso d uma
indicao sobre se a amostra aleatria ou no.
Conhece-se a distribuio normal dos valores de r que podemos esperar de
amostras aleatrias repetidas. Utilizando essa distribuio amostral, poderemos decidir se
determinada amostra observada apresenta mais ou menos iteraes do que provavelmente
ocorreriam numa amostra aleatria.
Poderemos, ento, testar as seguintes hipteses:
H0 : A amostra aleatria.
Ha : A amostra no aleatria.
No caso de amostras de maior dimenso (n1>20 ou n2>20) utiliza-se a seguinte
formula:
r r
Z
r
em que:
2n 1 n 2
1
Mdia = r
n1 n 2
Desvio-padro = r

2n1n 2 (2n1n 2 n1 n 2 )
(n1 n 2 ) 2 (n1 n 2 1)

15.4. O Caso de duas Amostras Relacionadas


Empregam-se os testes estatsticos de duas amostras, quando pretendermos
determinar se os dois tratamentos so diferentes, ou se um tratamento "melhor" que o
outro. O tratamento pode consistir numa diversidade de situaes ou condies.
Em cada caso, compara-se o grupo em que se aplicou o tratamento, com outro que
no sofreu nenhum tratamento, ou sofreu tratamento diferente.
Estes testes relacionam, de alguma forma, as duas amostras estudadas e tm a
vantagem de no exigir que todos os pares sejam extrados da mesma populao.

15.4.1. Teste de McNemar


O Teste de McNemar aplicvel aos experimentos do tipo antes/depois, em que
cada indivduo utilizado como seu prprio controle.
Para comprovar a significncia de qualquer mudana observada, constri-se uma
tabela de freqncias de quatro clulas, para representar o primeiro e o segundo conjunto
de reaes dos mesmos indivduos.
Depois
Antes
+
A
B
+
C
D
As clulas B e C so consideradas clulas de mudana e so as nicas utilizadas no
teste. O total de indivduos que acusam mudana m=B+C. Teremos, ento, a formula:
41

(B C) 2
(21)
BC
utilizando um fator de correo temos:
( B C 1) 2
2
Y
(21)
BC
As hipteses sero:
H0 : O tratamento no tem qualquer influncia.
Ha : O tratamento tem influncia.
Y2

15.4.2. Teste dos Sinais


O teste dos sinais utiliza como dados os sinais da diferena de cada par de valores
emparelhados, em vez de medidas quantitativas, ignorando as diferenas nulas. O uso deste
teste til nos casos de duas amostras relacionadas, quando pretendemos determinar se
duas condies so diferentes. O teste dos sinais exige que a varivel em estudo tenha
distribuio bsica contnua, no entanto, no supe que todos os indivduos tenham sido
extrados da mesma populao.
No caso de amostras de maior dimenso (N>25) utiliza-se a seguinte formula:
1
x N
x x
2
Z

1
x
N
2
em que:
1
Mdia = x = NP = N
2
1
Desvio-Padro = r = NPQ
N
2
Utilizando um fator de correo, temos:
1
( x 0,5) N
2 .
Z
1
N
2

15.4.3. Teste de Wilcoxon (Wilcoxons signed-rank test)


O teste de Wilcoxon no utiliza apenas as informaes sobre o sentido da diferena
dentro de cada par mas tambm o valor das diferenas, sendo, por isso, mais potente do
que o dos sinais. extremamente til nas pesquisas em que o pesquisador pode fazer o
julgamento do tipo maior que, entre os resultados de qualquer par, ou em relao s
diferenas relativas entre os pares de observaes.
O teste de Wilcoxon permite comprovar se no existem diferenas entre os valores
dos pares da amostra; considera o valor das diferenas de cada par e atribui maior peso a
um par cuja diferena entre as condies seja elevada do que a um par cuja diferena seja
pequena.
No caso de amostras de maior dimenso (N>25) utiliza-se a seguinte frmula:
T T
Z
T
em que:
42

T = Soma dos Postos.


N( N 1)
Mdia = T
4
Desvio-Padro = T

N( N 1)(2 N 1)
24

15.5. O Caso de duas Amostras Independentes


Quando a utilizao de duas amostras relacionadas no prtica ou apropriada,
podemos utilizar duas amostras independentes. Em tais projetos, as duas amostras podem
ser obtidas por um dos dois mtodos: (a) podem ser extradas aleatoriamente de duas
populaes ou (b) podem decorrer da atribuio aleatria de dois tratamentos aos membros
de uma amostra de origem arbitrria. Em nenhum destes casos se exige que as amostras
tenham a mesma dimenso.

15.5.1. Teste U de Mann-Whitney


O teste U de Mann-Whitney aplicado para comprovar se dois grupos
independentes foram ou no extrados da mesma populao. Trata-se de um dos mais
poderosos testes no paramtricos.
Consideremos duas amostras de populaes: da populao A e da populao B. A
hiptese nula H0 que A e B tm a mesma distribuio, enquanto que a hiptese
alternativa, Ha, que A e B tm distribuies diferentes.
Sejam:
n1= nmero de casos no grupo de menor dimenso.
n2= nmero de casos no grupo de maior dimenso.
R1= soma dos postos atribudos aos valores da primeira amostra.
R2= soma dos postos atribudos aos valores da segunda amostra.
n (n 1)
n (n 1)
U1 n 1 .n 2 1 1
R 1 U 2 n 1 .n 2 2 2
R2
2
2
U 2 n1 .n 2 U1
U min( U1 ; U 2 ) , que comparado a valores tabulados.
No caso de amostras de maior dimenso (n2>20) utiliza-se a seguinte formula:
U U
Z
U
em que:
n (n n 2 1)
Mdia U 1 1
2
n1n 2 (n1 n 2 1)
Desvio-Padro = U
12
e aplica-se o teste da distribuio normal.

15.6. O caso de K amostras relacionadas


Quando se trata de comparar trs ou mais amostras ou condies num experimento,
necessrio aplicar um teste estatstico que indique se h uma diferena global entre as k
amostras ou condies, antes que possamos analisar a significncia da diferena entre duas
amostras.
43

15.6.1. Teste Q de Cochran


O teste de McNemar para duas amostras pode ser generalizado para o caso de mais
do duas amostras atravs do teste Q de Cochran para K amostras relacionadas, o qual
permite comprovar se trs ou mais conjuntos correspondentes de freqncia ou propores
diferem significativamente entre si.
O teste Q de Cochran adapta-se especialmente ao caso em que os dados se
apresentam numa escala nominal ou sob forma de informao ordinal dicotomizada (1 e 0),
os dados so dispostos numa tabela N*K, onde a frmula usada :
2
k
k

2
(k 1) k G j G j
j1
j1
, em que:
Q
N
N
2
k Li Li
i 1

i 1

K - nmero de amostras
Gj nmero de sucessos na coluna j
Li nmero de sucessos na linha i

15.6.2. Teste de Friedman


Quando os dados de k amostras correspondentes se apresentam pelo menos em
escala ordinal, o teste de Friedman til para comprovar a hiptese nula, de que k amostras
tenham sido extradas da mesma populao.
Como as k amostras esto em correspondncia, o nmero de casos o mesmo em
cada uma delas. A correspondncia pode ser estabelecida, estudando-se o mesmo grupo de
indivduos sob cada uma das k condies.
Para o teste de Friedman, os dados se dispem em uma tabela de dupla entrada com
N linhas e k colunas. As linhas representam os vrios indivduos ou conjuntos
correspondentes de indivduos e as colunas representam as diversas condies.
A frmula usada pelo teste de Friedman a seguinte

X 2

K
12
(R j ) 2 3N(K 1)

NK(K 1) j1

em que:
N nmero de linhas
K nmero de colunas
Rj soma de ordens na coluna j
K

2
(R j ) - somatrio dos quadrados das somas das ordens sob todas as K condies.

j 1

15.7. O caso de k Amostras Independentes


freqente a necessidade de decidir se diversas variveis independentes devem ser
consideradas como provenientes da mesma populao. A dificuldade consiste em
determinar se as diferenas amostrais observadas sugerem realmente diferenas entre as

44

populaes ou se so apenas variaes casuais, que podem ser esperadas entre amostras
aleatrias da mesma populao.
A tcnica paramtrica usual para comprovar se diversas amostras independentes
provm da mesma populao a anlise de varincia. A mensurao da varivel em estudo
tem de ser feita, no mnimo, em escala intervalar. Os testes no paramtricos tm, ainda, a
vantagem de permitir estudar dados em escala nominal ou ordinal.

15.7.1. Teste de Kruskal-Wallis


O teste de Kruskal-Wallis extremamente til para decidir se k amostras
independentes provm de populaes diferentes. Os valores amostrais quase que
invariavelmente diferem entre si, consistindo o problema em decidir se essas diferenas
entre as amostras significam diferenas efetivas entre as populaes ou, se apenas
representam variaes casuais, que podem ser esperadas entre amostras aleatrias de uma
mesma populao.
O teste de Kruskal-Wallis comprova a hiptese nula de que k amostras provenham
da mesma populao ou de populaes idnticas, em relao s mdias. O teste supe que
a varivel em estudo tenha distribuio inerente contnua e exige mensurao no mnimo
ao nvel ordinal.
Se as K amostras provm efetivamente da mesma populao, ou de populaes
idnticas, ento a estatstica H, utilizada neste teste, tem distribuio qui-quadrado com
K-1 graus de liberdade, desde que as dimenses das amostras no sejam muito pequenas,
isto :
2
K Rj
12
H
3( N 1)

N( N 1) j1 n j
em que:
K nmero de amostras;
nj nmero de casos na amostra j;
N nmero de casos em todas as amostras combinadas;
Rj soma de ordens na amostra j (coluna); e
2
K Rj

- indica o somatrio sobre todas as amostras(coluna)


j 1 n
j

15.7.2. Coeficiente de correlao de Spearman ou de Postos (Rank


Correlation)
O coeficiente de correlao, r, aplicvel distribuio normal bivariada. Diversos
coeficientes que no necessitam da pressuposio de que a distribuio seja normal
bivariada, tm sido propostos.
O coeficiente de correlao de Spearman se aplica a dados na forma de
classificao em posies (postos). Os dados podem ser coletados em postos ou podem ser
classificados aps o exame em alguma escala. Mede a correspondncia entre as ordens de
tal forma que no necessariamente uma medida de correlao linear.
O procedimento o seguinte:
a) Ordenar as observaes de cada varivel;
b) Obter a diferena no posto dos pares de dados (di);
c) Estimar pela equao dada a seguir (rS);
d) Se o nmero de pares for grande, pode-se utilizar o teste t.

45

6 d i2
rS 1

t rS

(n 1)n (n 1)

n2
1 rS2

, distribudo como o t de Student, com n-2 gl.

16. LITERATURA RECOMENDADA


01. BANCROFT, T. A. Topics in Intermediate Statistical Methods. Ames: The Iowa State
University Press, 1968. 129p. v. 1.
02. BOX, G.E.P. & DRAPER, N.R. Empirical Model-Building and Response Surfaces.
New York: John Wiley, 1987. 688p.
03. BRUNNER, E., DOMHOF, S. & LANGER, F. Nonparametric Analysis of
Longitudinal Data in Factorial Experiments. New York: John Wiley, 2002. 261p.
04. COCHRAN, W.G. & COX, G.M. Experimental Designs. New York, John Wiley,
1992. 640p.
05. COX, D. Planning of Experiments. New York: John Wiley, 1992. 320 p.
06. DARLINGTON, R.B. Regression and Linear Models. New York: McGraw-Hill, 1990.
542p.
07. DEY, A. & MUKERJEE, R. Fractional Factorial Plans. New York: John Wiley, 1999.
288p.
08. DRAPER, N.R. & SMITH, H. Applied Regression Analysis. New York: John Wiley,
1998. 706p.
09. FISHER, R.A. & BENNETT, J.H. Statistical Methods, Experimental Design, and
Scientific Inference. New York: Oxford Univ. Press, 1990. 832p.
10. GOMEZ, K.A. & GOMEZ, A.A. Statistical Procedures for Agricultural Research.
New York: John Wiley, 1984. 704 p.
11. HOCHBERG, Y. & TAMHANE, A.C. Multiple Comparison Procedures. New York:
John Wiley, 1987. 480p.
12. HOFFMANN, R. & VIEIRA, S. Anlise de Regresso. So Paulo: Hucitec, 1987. 379
p.
13. HOSME, D.W. & LEMESHOW, S. Applied Logistic Regression. New York: John
Wiley, 1989. 307p.
14. JOHNSON, R.A. & WICHERN, D.W. Applied Multivariate Statistical Analysis.
Englewood Cliffs: Prentice-Hall, 1982. 594p.
15. KLEINBAUNN, D.G. & KLEIN, M. Survival Analysis: A Self-Learning Text. New
York: Springer, 2005. 590p.
16. LEE, E.T. Statistical Methods for Survival Data Analysis. New York: WileyInterscience, 1992. 496p.

46

17. MICKEY, R.M.; DUNN, O.J.; CLARK, V.A. Analysis of Variance and Regression.
New York, John Wiley, 2004. 448p.
18. MONTGOMERY, D.C. & MYERS, R.H. Response Surface Methodology: Process
and Product in Optimization Using Designed Experiments. New York: John Wiley,
1995. 700 p.
19. MONTGOMERY, D.C. & PECK, E.A. Introduction to Linear Regression Analysis.
New York: John Wiley, 1992. 544 p.
20. MONTGOMERY, D.C. Design and Analysis of Experiments. New York: John Wiley,
1996. 704 p.
21. NELSON, W. Accelerated Testing: Statistical Models, Test Plans, and Data Analyses.
New York: John Wiley, 1990. 616p.
22. NETER, J.; WASSERMAN, W. & KUTNER, M.H. Applied Linear Statistical
Models. Boca Raton: CRC Press, 1990. 1184p.
23. ROBINSON, G.K. Practical Strategies for Experimenting. New York: John Wiley,
2000. 232p.
24. RYAN, T. Modern Experimental Design. New York: John Wiley, 2007. 593p.
25. RYAN, T.P. Modern Regression Methods. New York: John Wiley, 1996. 515 p.
26. SCHABENBERGER, O. & PIERCE, F.J. Contemporary Statistical Models for the
Plant and Soil Sciences. Boca Raton: CRC Press, 2002. 738p.
27. SCHEINER, S.M. & GUREVITCH, J. Design and Analysis of Ecological
Experiments. New York: Osford University Press, 2001. 415p.
28. SEARLE, S.R. Linear Models. Nova York: John Wiley, 1997. 532 p.
29. SEBER, G.A. & WILD, C.J. Nonlinear Regression. New York: John Wiley, 1989.
800p.
30. SNEDECOR, G.W. & COCHRAN, W.G. Statistical Methods. Iowa: Iowa State
University, 1989.
31. STEEL, R.G.D.; TORRIE, J.H. & DICKEY, D.A. Principles and Procedures of
Statistics: A Biometrical Approach. New York: McGraw-Hill.1997. 666 p.

47