Você está na página 1de 16

4.

ANLISE DE VARINCIA

Pode-se considerar de uma maneira simplista, que o objetivo em um


experimento saber se os tratamentos tm mdias iguais (*). Os tratamentos so
amostras e se estas amostras foram retiradas de uma mesma populao, suas mdias
sero estimativas de um mesmo parmetro: a mdia populacional. Neste caso, as mdias
dos tratamentos no deveriam diferir entre si. Se as mdias so diferentes entre si, ento
as amostras (tratamentos) no pertencem a uma mesma populao e a concluso que
realmente os tratamentos tm efeitos diferentes (por exemplo, uma variedade mais
produtiva que a outra).
Como existem outras fontes de variao afetando os resultados de um
experimento alem do efeito dos tratamentos, no possvel tomar uma deciso com
base apenas nas mdias dos tratamentos.

4.1 Causas da Variabilidade


Todo conjunto de dados numricos pode apresentar variabilidade entre seus
componentes. Por exemplo, seja o conjunto seguinte cujos valores representam pesos
em kg:
W = {2,0; 2,2; 2,3; 2,5; 3,0; 3,2; 2,8; 2,9; 2,4; 2,7}
Atravs de um clculo simples pode-se ter uma idia da variabilidade deste
conjunto como, por exemplo, atravs da soma dos quadrados dos desvios de cada dado
em relao mdia do conjunto. A mdia deste conjunto igual a 2,6 kg e a soma de
quadrados dos desvios:
SQD = (2,0 2,6)2 + (2,2 2,6)2 + ... + (2,7 2,6)2 = 1,32 kg2
Considere que o conjunto W contenha as produes, em kg/10m2, de uma
variedade de trigo: ... as sementes usadas so de uma variedade recomendada para
Minas Gerais. Foram plantadas no campo experimental da Universidade Federal de
Lavras - UFLA, com semeadura realizada no ms de maio de 1997, sob regime de
cultivo irrigado. O solo um Latossolo Vermelho Amarelo, corrigido de acordo com a
anlise de terra, seguindo as recomendaes da Comisso Centro Brasileira de Pesquisa

28

do Trigo. Os tratos culturais e controle de pragas e doenas foram os comuns para a


cultura. Foi obtido o peso de gros na rea til de cada parcela (10 m2)...
Neste caso, razovel supor que a variabilidade observada no conjunto de dados
W seja devida a:

heterogeneidade na fertilidade do solo,


variabilidade gentica das sementes,
variaes na conduo do experimento (variaes na correo do solo,
na irrigao, na adubao, na conduo, na colheita e pesagem e outros),
outras causas aleatrias (ataques de pragas e doenas, etc).
Considere agora que as produes do conjunto W sejam devidas a duas
variedades de trigo e que o subconjunto WA contenha as produes da variedade A e
WB as produes de outra variedade B:
WA = {2,0; 2,2; 2,3; 2,5; 3,0}

Mdia = 2,4 kg

WB = {3,2; 2,8; 2,9; 2,4; 2,7}

Mdia = 2,8 kg

Pode-se calcular a variabilidade em cada um destes conjuntos por:


SQD dentro de WA = (2,0 2,4)2 + (2,2 2,4)2 + ... + (3,0 2,4)2 =

0,58 kg2

SQD dentro de WB = (3,2 2,8)2 + (2,8 2,8)2 + ... + (2,7 2,8)2 =

0,34 kg2

Assim, mais uma fonte de variao deve ser considerada como presente no
conjunto W: as duas variedades. Neste exemplo estas variedades so os tratamentos que
propositadamente foram includos no experimento. Neste caso do interesse do
pesquisador comparar as produes das duas variedades.
Tem-se ento um experimento com dois tratamentos (variedades A e B de trigo)
e com 5 repeties para cada tratamento. A variabilidade observada neste experimento
provavelmente devida a:

heterogeneidade na fertilidade do solo,


variabilidade gentica das sementes,
variaes na conduo do experimento (variaes na correo do solo, na
irrigao, na adubao, nos tratos culturais, na colheita e pesagem e outros),
outras causas aleatrias (ataques de pragas e doenas, outras),
duas variedade de trigo.
Uma questo pode ser colocada: porque a soma de SQD dentro de WA com SQD
dentro de WB no igual SQD do conjunto todo?

29

4.2

Anlise da Variabilidade
O interesse do pesquisador est em comparar as mdias de produtividade das

variedades A e B e concluir se so iguais ou no. As mdias foram 2,4 e 2,8 kg/10m2


respectivamente, mas como existem outras fontes de variabilidade afetando os dados
obtidos neste experimento alem do efeito das variedades, no possvel basear apenas
nestes dois valores para concluir que a variedade B realmente a mais produtiva do que
a variedade A.
A tcnica estatstica para tentar respostas para problemas deste tipo foi
introduzida por R. A. FISHER, na dcada de 20 e chamada Anlise de Varincia. O
primeiro passo consiste na formalizao da hiptese a ser testada. A hiptese de que no
existem diferenas entre os efeitos dos tratamentos de um experimento (H0) pode ser
formalizada do seguinte modo:
H0 : 1 = 2 =

= I

A hiptese alternativa que existe pelo menos uma diferena entre efeitos de
tratamentos. Ento, se os dados do experimento justificar a no rejeio de H0, concluise que no existem diferenas entre os efeitos dos tratamentos. Para o teste de H0,
admite-se o nvel de significncia e monta-se a tabela descrita a seguir, onde ser
realizado o teste apropriado para esta H0.

4.2.1 Tabela da Anlise de Varincia


A variabilidade presente em um ensaio analisada com o auxlio de um quadro
padro denominado Tabela da Anlise de Varincia, cujo modelo apresentado a seguir
e onde as colunas referem-se a:
FV Fontes de Variao - Nesta coluna so descritas as causas de variabilidade dos
dados do experimento. O interesse do pesquisador est em conhecer a variabilidade
entre os TRATAMENTOS. As outras fontes de variabilidade so agrupadas em
RESDUO (correspondente variabilidade existente Dentro dos Tratamentos).
GL Graus de Liberdade - A cada fonte de variao est associado um nmero de
graus de liberdade.
SQ Somas de Quadrados - So as somas dos quadrados de desvios calculadas para
cada fonte de variao.
QM Quadrados Mdios - So obtidos pela razo entre as Somas de Quadrados e os
seus respectivos graus de liberdade. Pode-se demonstrar que so estimativas de
varincias.
30

FC valor da estatstica F - o valor obtido para a estatstica do teste de F, dado pela


razo entre os QM de Tratamentos e o QM do Resduo.
Tabela da Anlise de Varincia
FV

GL

SQ

QM

Fc

Entre Tratamentos

GLEntre

SQEntre

SQEntre/GLEntre

QMEntre/QMDentro

Dentro de Tratamentos

GLDentro

SQDentro

SQDentro/GLDentro

Total

GLTotal

SQTotal

Observa-se que a Variabilidade Total existente nos dados do experimento ser


dividida em:
Variabilidade Dentro de Tratamentos
provocada por vrias fontes de
variabilidade exceto tratamentos, e
Variabilidade Entre Tratamentos
provocada pelos tratamentos e por outras
fontes de variabilidade.
4.2.2 Procedimento Geral
Seja um experimento com I tratamentos, cada tratamento com ri repeties. Y a
varivel resposta e os dados observados sero representados por yij , onde i refere-se ao
tratamento e j refere-se repetio. O nmero total de parcelas N = I x J no caso de
mesmo nmero de repeties (J) ou N =
ri . Aps a coleta das observaes, os dados
i

so organizados em um quadro como a seguir.

Tratamentos
1
2
...
I

1
y11
y21
...
yI1

Repeties
2
y12

...
...

J
y1J

y22
...
yI2

...
...
...

y2J
...
yIJ

Totais
de
Tratamentos
T1
T2
...
TI

Fontes de Variao:

A variao observada entre todos os dados, tambm


chamada de Variao Total, dividida em Variao Entre
Tratamentos (Tratamentos)
e Variao Dentro de
Tratamentos (Resduo ou ERRO EXPERIMENTAL ).

Graus de Liberdade (GL):

Para Tratamentos, a quantidade de tratamentos menos


um (I 1). Para Total o nmero total de parcelas
menos um (N 1). Para o Erro Experimental, a soma
dos graus de liberdade dentro de cada tratamento, que
31

corresponde ao nmero de repeties do tratamento menos


um, para cada um deles. O Grau de Liberdade para o Erro
Experimental tambm pode ser obtido pela diferena entre
o GLTotal e o GLTratamentos.
Soma de Quadrados (SQ): As definies das somas de quadrados so:
. Soma de Quadrados Total - a soma dos quadrados das
diferenas entre cada observao e a mdia geral do
experimento.
_

SQTOTAL =
ij

( y ij y .. ) 2

Desenvolvendo o 2o termo, chega-se a:


y ij ) 2

(
SQTOTAL =

y ij2

ij

N
. Soma de Quadrados Entre Tratamentos - corresponde
a soma dos quadrados das diferenas entre as mdias de
cada tratamento e a mdia geral lembrando que cada
ij

SQTRATAMENTOS =
i

ri ( y i. y ) 2

mdia de tratamento foi obtida de J repeties.

A frmula prtica :
2

SQTRATAMEN TOS =
i

Ti

ri

x ij ) 2

(
ij

onde Ti o total de cada tratamento e ri o nmero de


repeties do tratamento i.
. Soma de Quadrados do Erro Experimental - o
somatrio das somas de quadrados dos desvios entre as
repeties de cada tratamento e sua mdia, considerados
todos os I tratamentos.
SQErro =

( y ij y i. ) 2
i

Na prtica, calcula-se:
SQTratamentos.

SQErro

SQTotal

32

Quadrados Mdios (QM):

Cada Quadrado Mdio obtido dividindo-se a Soma de


Quadrados pelo respectivo nmero de Graus de Liberdade.

Valor de F calculado (FC):

Dado pela razo entre o QMEntreTratamentos e o


QMErro.

Considerando os dados do conjunto W, tem-se:


SQTotal
= 2,02 + 2,22 + ... + 2,72 - 262 /10 = 1,32
SQEntre Variedades
= 1/5 ( 122 + 142 ) - 262 /10 = 0,40
SQErro
= 1,32 0,40 = 0,92
Como outro exemplo, os dados da Tabela 4.2, so as produes de massa verde
(t/ha) de uma cultivar de sorgo plantado em trs diferentes espaamentos.

Tabela 4.1 Quadro da Anlise de Varincia para os Dados do Conjunto W.


Fontes de Variao
GL
SQ
QM
FC
Entre Variedades
1
0,40
0,40
3,33
Erro Experimental
8
0,92
0,12
Total
9
1,32
Tabela 4.2

Produes de Massa Verde (t/ha) de uma Cultivar de Sorgo.


ESPAAMENTOS

REPETIES

0,50

0,75

0,90

186

158

190

II

180

173

215

III

187

175

221

IV

181

174

195

184

170

210

TOTAIS

918

850

1.031

Os clculos das somas de quadrados so dados por:


SQTOTAL = 1862 + 1582 + ... + 2102 - 27992 /15 = 4.273,60
SQTRATAMENTOS = 1/5 (9182 + 8502 + 10312 ) - 27992 /15 = 3.343,60
SQERRO = SQTOTAL SQ TRATAMENTOS
Com os valores do Quadro da Anlise de Varincia, realiza-se o teste para as
hipteses sobre os efeitos dos tratamentos. As hipteses so:
Ho : No existem diferenas entre os efeitos dos tratamentos
Ha : Existe, pelo menos, uma diferena entre os efeitos dos tratamentos.

33

Tabela 4.3 Anlise de Varincia para as Produes de Massa Verde.


Fontes de Variao

SQ

QM

FC

3.343,60

1.671,80

21,57

Erro Experimental

12

930,00

77,50

Total

14

4.273,60

Espaamentos

GL

4.2.3 Teste de F
Para o teste destas hipteses necessrio que os dados experimentais satisfaam
a algumas pressuposies. Estes requisitos so denominados Hipteses Fundamentais
da Anlise de Varincia e sero discutidos posteriormente. Admitindo que estas
condies tenham sido satisfeitas, tem-se que:
-

A esperana matemtica do Quadrado Mdio do Erro Experimental 2 e, para

o Quadrado Mdio de Tratamentos 2 + k ti2 , onde k uma constante e ti


representa o efeito do tratamento i.

Isto significa que os Quadrados Mdios so

estimativas de varincias;
-

Se H0 for verdadeira, ento o QMTratamentos e o QMErro sero estimativas do

mesmo parmetro e, portanto, a razo entre eles dever ser prxima de 1,


-

Se H0 for falsa, as reais diferenas entre os tratamentos aumentaro o valor de

SQTratamentos mas no afetaro a SQErro. Logo, a razo entre QMTratamentos e


QMErro ser maior que 1,
-

A distribuio de probabilidade para a razo entre duas varincias conhecida

como distribuio de F. A estatstica FC = QMTratamentos/QMErro tem distribuio


de F com GLTratamentos e GLErro.
Feitas estas consideraes, o teste de F pode ser realizado. O primeiro passo
escolher o nvel de significncia ( ). Geralmente toma-se = 5% ou menor. Esta a
probabilidade do erro Tipo I, isto , a probabilidade de rejeitar-se H0 quando a mesma
for verdadeira.
A maioria dos programas computacionais utilizados para a anlise de varincia
determina o nvel de significncia exato para cada teste de F. Quando este recurso no
estiver disponvel, utilizam-se tabelas de F.
Escolhido o nvel de significncia, a regra de deciso para o teste de F :

34

1- Se o valor de Fc for maior que o valor de F tabelado, ao nvel de % de


probabilidade, rejeita-se H0 . O teste considerado significativo ao nvel de
% de probabilidade e admite-se que, ao nvel de % de probabilidade,
existe pelo menos uma diferena entre os efeitos dos tratamentos.
2- Caso o valor de Fc seja menor ou igual ao valor de F ao nvel de %, no
existem evidencias para rejeitar-se H0. O teste dito no-significativo ao
nvel de % implicando em 95% de confiana de que no existem diferenas
entre os efeitos dos tratamentos.
3Para os dados da Tabela 4.1, segundo a regra de deciso, no existem evidncias
para rejeitar H0, portanto conclui-se que no existe diferena significativa entre as
produtividades mdias das duas variedades. A diferena observada entre as duas mdias
(2,4 para 2,8) considerada como sendo igual a zero. A Figura 4.2 apresenta o teste de
F para a Anlise de Varincia da Tabela 4.1.

RAH

RRH

0,0

Figura 4.1.

Valor de F tabelado

Regra de deciso para o teste de F ao nvel de % de probabilidade.

35

3,48 (Valor de F calculado)

RAH0
95%
RRHo
5%
5,32 (Valor de F tabelado)

Figura 4.2.

Teste de F ao nvel de 5% de probabilidade para o conjunto W.

21,57 (Valor de F calculado)

RAH0
95%

RRH0

5%

3,89 (Valor de F tabelado)

Figura 4.3.

Teste de F ao nvel de 5% de probabilidade para a Tabela 4.3.

Neste exemplo o teste de F foi significativo levando no aceitao de H0.


Existe pelo menos uma diferena significativa entre as produes mdias de massa
verde em funo dos trs espaamentos, ao nvel de 5% de probabilidade. Sendo trs
espaamentos, como descobrir as diferenas significativas entre as mdias dos
tratamentos?

36

5.
PRESSUPOSIES DA ANLISE DE VARINCIA

Nas dcadas de 20 e 30, Ronald A. Fisher foi o pesquisador responsvel


pela anlise de dados da Estao Experimental de Rothamsted de Londres, Inglaterra.
Ele foi o pioneiro no uso de mtodos estatsticos nos delineamentos experimentais.
Fisher desenvolveu a anlise de varincia como o primeiro mtodo de
anlise de dados experimentais. A maioria das aplicaes foi feita nas reas de
agricultura e biologia, mas atualmente, constitui uma das principais tcnicas utilizadas
em todas as reas do conhecimento. A utilizao da Anlise de Varincia para um
conjunto de dados provenientes de algum experimento pressupe a verificao de
algumas hipteses.

5.1

HIPTESES FUNDAMENTAIS DA ANLISE DE VARINCIA


As hipteses so:
1. Os diferentes efeitos admitidos no modelo estatstico so aditivos
(aditividade).
2. Os erros das observaes no so correlacionados (independncia).
3. Os erros tm a mesma varincia (homocedasticidade).
4. Os erros tm distribuio Normal (normalidade).

5.1.1 Aditividade
Os efeitos admitidos em um modelo estatstico devem ser adtivos. O modelo
estatstico para o delineamento Blocos Casualizados, por exemplo, implica em que o
efeito de um tratamento o mesmo em todos os blocos e o efeito de um bloco o
mesmo em todos os tratamentos. Uma consequncia da aditividade que as diferenas
entre os efeitos de dois tratamentos A e B, usualmente estimada por:
mdia de todas observaes com A mdia de todas as observaes com B
A Tabela 5.1 apresenta dois conjuntos de dados supondo um modelo aditivo

(y = ti + b j )

e outro multiplicativo

(y = ti b j ) .

Tomaram-se os modelos sem erro

experimental para facilitar a compreenso.

37

A no aditividade resulta na heterogeneidade do erro e afeta o nvel de


significncia para comparaes entre os tratamentos. H perda de preciso porque o
Erro Experimental acrescido do componente de no aditividade.

5.1.2 Normalidade
Quando esta hiptese no satisfeita, alm da introduo de erro no nvel de
significncia do teste F e de outros, h uma perda de eficincia na estimao dos efeitos
de tratamentos e uma correspondente perda de poder dos testes.
So propostos diversos testes para a verificao de distribuio Normal dos
erros, tais como: KolmogorovSmirnov, ShapiroWilks; utilizao de coeficientes da
distribuio tais como assimetria e curtose, entre outros. Outra ferramenta til para a
verificao da normalidade o uso do papel normal de probabilidade onde devem ser
plotados os resduos (diferenas entre as observaes e a mdia dos dados). A vantagem
da anlise de resduos que, por simples inspeo do grfico, pode-se concluir sobre a
Normalidade.

5.1.3 Independncia
Como independncia dos erros entende-se que a probabilidade do erro de uma
observao ter certo valor no depende dos valores dos erros de outras observaes.

Tabela 5.1

Modelos Aditivo e Multiplicativo Admitida a Ausncia de Erro.

Modelo
Aditivo

Multiplicativo

Logartimo do
Multiplicativo

Modelo

Bloco I

Bloco II

Bloco I

Bloco II

Bloco I

Bloco II

Tratamento A

10

20

10

20

1,00

1,30

Tratamento B

30

40

30

60

1,48

1,78

Fonte: Steel e Torrie (1960)

Quando os erros so correlacionados, os testes de significncia no so vlidos.


H casos em que, devido a uma correlao positiva entre os erros, o teste de F leva a um
excesso de resultados significativos. Em casos de correlao negativa, o valor da
estatstica Fc pode ser muito menor que um.
A dependncia entre os erros comum em ensaios quando uma unidade usada
vrias vezes como unidade experimental ou quando diferentes parcelas esto em contato
fsico direto. Como exemplo, comum a correlao entre as observaes de ensaios de
38

campo onde a semelhana entre as observaes de parcelas adjacentes maior de que


entre parcelas distantes ou em ensaios de laboratrio, nas observaes feitas por uma
mesma pessoa ou durante determinado intervalo de tempo.
Plotando os resduos na ordem em que os dados foram coletados (resduos
versus tempo) pode-se verificar facilmente a existncia de correlao entre eles. Quando
os resduos se distribuem de maneira desordenada, pode-se pensar em no existncia de
correlao.

5.1.4 Homocedasticidade
A falta de homogeneidade de varincia uma das mais graves quebras de
suposio bsica principalmente para os modelos no balanceados e os modelos de
efeitos aleatrios. Atravs de um grfico de resduos versus o valor estimado Yij ou
versus a varivel X (tratamentos), pode-se detectar a no homogeneidade de varincia.
Em geral, os resduos devem ser no correlacionados com qualquer outra varivel. Os
grficos devem apresentar a ausncia de estrutura entre os resduos e a outra varivel
plotada. Tambm, existem vrios testes para a verificao da homocedasticidade: teste
de Anscombe e Tukey, teste de Bartlett, etc.
A heterogeneidade dos erros pode ser classificada como irregular e regular. A
heterogeneidade irregular quando aparentemente no existe uma relao entre mdias
e varincias enquanto que, existindo certa relao entre as mdias e as varincias dos
vrios tratamentos, a heterogeneidade dita regular.

5.2

CASOS DE HIPTESES FUNDAMENTAIS NO SATISFEITAS


Quando uma destas hipteses no satisfeita, a anlise de varincia no tem

validade como tcnica de anlise estatstica e torna-se um simples tratamento


matemtico dos dados coletados. Para alguns destes casos podem existir alternativas
simples. Na maioria destes casos, as falhas nestas premissas so provocadas por:
assimetria extrema, presena de erros grosseiros, comportamento anormal de certos
tratamentos ou parte do experimento, no aditividade e varincias como funo das
mdias.
Para os casos de heterocedasticidade, quando a heterogeneidade irregular, por
exemplo, alguns dos mtodos utilizados so: omisso de determinada parte do

39

experimento (tratamentos) ou subdivises de tal forma que, com os tratamentos


restantes ou dentro de cada subdiviso consiga-se homogeneidade de varincia residual,
transformao prvia dos dados e outros. Para o caso de heterogeneidade regular, um
dos procedimentos mais utilizados o da transformao de dados.
Existem muitas outras tcnicas de anlise de dados alm da anlise de varincia,
tais como: o mtodo dos Mnimos Quadrados Ponderados para o caso de no
homocedasticidade, o mtodo dos Mnimos Quadrados Generalizados para o caso de
erros correlacionados, a anlise No-Paramtrica para o caso de no normalidade.

5.2.1

A tcnica da transformao de dados


Sendo conhecida a distribuio da qual so provenientes os dados, a relao

entre a mdia e a varincia dos tratamentos tambm conhecida e nestes casos, os


dados podem ser transformados de modo que passem a ter distribuio
aproximadamente normal e as mdias e varincias se tornem independentes, resultando
tambm em varincias homogneas.
Em muitos casos, uma transformao adequada dos dados permite a obteno de
um novo conjunto de nmeros que satisfaz s todas as hipteses fundamentais. A
anlise de varincia pode ser aplicada neste novo conjunto e os resultados inferidos para
o conjunto original. Uma transformao adequada aos dados seria aquela em que:
-

A varincia da varivel transformada no fosse afetada por mudanas do valor


mdio;
A varivel transformada fosse normalmente distribuda;
A escala de transformao fosse tal que a mdia aritmtica estimasse
imparcialmente a mdia verdadeira;
A escala de transformao fosse tal que os efeitos reais fossem lineares e
aditivos.
Quando uma transformao de dados feita, todas as comparaes e estimativas

de intervalo de confiana devem ser determinadas na nova escala, sendo que as mdias
podem ser transformadas para a escala original.
A mudana exata da escala , em geral, difcil e a escolha de uma transformao
adequada depende, em parte, da experincia do estatstico. Em geral, aps a escolha e
utilizao de uma transformao de dados, novamente deve ser verificado se as
hipteses bsicas foram satisfeitas.

40

O estudo das relaes entre mdias e varincias de tratamentos pode sugerir uma
possvel transformao de dados(ver APENDICE 3). Algumas transformaes de dados
bastante utilizadas so: Raiz Quadrada, Logartmica e Angular.

a) Transformao Raiz Quadrada


Utilizada para dados provenientes de contagens como: nmero de bactrias em
uma placa, nmero de plantas ou insetos em uma dada rea, nmero de defeitos ou
acidentes. Geralmente eles se distribuem de acordo com a distribuio de Poisson, em
que a mdia e a varincia so iguais. Neste caso, a transformao raiz quadrada dos
dados estabiliza a varincia, alm de torn-la independente da mdia.
A transformao raiz quadrada pode tambm ser usada com dados de contagens
em que a varincia de X proporcional mdia de X, ou seja, x2 = KX . Para a
distribuio de Poisson tem-se K = 1, mas, frequentemente, encontra-se K > 1, o que
indica que a distribuio dos erros tem uma varincia maior que aquela de Poisson.
Dados de porcentagem baseados em contagens com um denominador comum,
sendo a amplitude de 0% a 20% ou de 80% a 100%, mas no ambas, podem tambm
ser analisados utilizando-se a transformao raiz quadrada. Quando os dados esto
situados entre 80% e 100%, devem ser subtrados de 100 antes da transformao. A
mesma transformao til para porcentagens na mesma amplitude quando as
observaes provm de uma mesma escala contnua, desde que mdias e varincias
sejam aproximadamente iguais.
Quando entre os dados ocorrem valores pequenos, inferiores a 10 e,

X + 1 ou

X + X +1

principalmente, zeros, as transformaes

X +1/ 2 ,

estabilizam a varincia mais efetivamente que

X , sendo X o valor observado.

A transformao raiz quadrada afeta o tipo de achatamento da distribuio de


frequncia dos erros e a medida de aditividade. Assim, se os efeitos de blocos e
tratamentos so aditivos na escala original, geralmente no o sero na escala raiz
quadrada ou vice versa. Contudo, a menos que efeitos de blocos e tratamentos sejam
ambos grandes, efeitos que so aditivos em uma escala sero aproximadamente aditivos
na escala raiz quadrada.
As mdias obtidas com os dados transformados so reconvertidas para a escala
original, utilizando-se da operao inversa, ou seja, sendo elevadas ao quadrado. Os
41

valores obtidos, geralmente so ligeiramente menores que as mdias originais, porque a


mdia de uma srie de razes quadradas menor que a raiz quadrada da mdia original.

b) Transformao Logartmica
A transformao logartmica estabiliza a varincia quando o desvio padro na
escala original varia diretamente com a mdia, ou seja, o coeficiente de variao
constante de tratamento para tratamento. Esse tipo de relao entre mdia e desvio
padro encontrado geralmente quando os efeitos so multiplicados em lugar de
aditivos. Nesta situao, tal transformao, alm de estabilizar a varincia, produz
aditividade nos efeitos e tende a normalizar a distribuio dos erros. A base 10 para o
logaritmo a mais usada, por convenincia, contudo, qualquer base satisfatria.
Essa transformao usada para nmeros inteiros positivos que cobrem uma
grande amplitude, sendo que no pode ser usada diretamente quando ocorrem zeros ou
quando alguns dos valores so menores que 10. Neste caso, necessrio ter-se uma
transformao que equivale transformao

X para valores pequenos e log X para

valores grandes de X. A transformao log(X+1) a que mais se aproxima da desejada.


As mdias obtidas na escala logartmica so convertidas para a escala original
atravs da operao inversa, ou seja, utilizando-se antilogartmos dos valores obtidos
para essas mdias estando, porm afetadas de um erro.

c) Transformao Angular ou arc sen

p / 100

Esta transformao utilizada para homogeneizar a varincia residual dos dados


de proporo X/N, ou porcentagens 100 ( X / N ) , correspondentes a indivduos
portadores de um dado atributo, em uma amostra de tamanho N e especialmente
recomendada quando as porcentagens cobrem uma grande amplitude de valores.
Admite-se que as propores tm distribuio binomial com mdia igual a e varincia
igual a (1 ) N . Desde que as propores tm distribuio binomial, essa varincia
ser mxima para p = 0,5 . As propores igualmente afastadas de 0,5 tero varincias
iguais e quanto mais afastadas de 0,5, valores menores. A transformao ir, pois,
alterar as porcentagens extremas, ou seja, aquelas de menores varincias.
SNEDECOR e COCHRAN (1976) dizem que essa transformao tambm pode
ser usada para propores que esto sujeitas a outra causa de variao que no a

42

binomial, sendo porem que a varincia dessas propores deve ser um mltiplo de (1). Como, porm, esse produto varia pouco se as porcentagens estiverem todas entre
30% e 70%, a transformao angular ser desnecessria. Essa transformao produzir
sensveis alteraes nos valores das porcentagens se estiverem entre 0% e 30% ou 70%
e 100%. A transformao arc sen
porcentagens

forem

baseadas

em

% dar melhores resultados quando todas as

denominadores

iguais,

porm,

tem

sido

frequentemente usada quando so diferentes, especialmente, se so aproximadamente


iguais.
Pode acontecer que a varivel X/N no tenha distribuio binomial e que a
transformao angular no atinja seu objetivo, como o caso, muitas vezes, de dados de
controle de pragas e molstias no campo. Neste caso, deve-se considerar o numerador
da proporo como a varivel aleatria, podendo ser analisada utilizando-se uma das
transformaes citadas anteriormente.
A transformao raiz quadrada recomendada para porcentagens entre 0% e
20% ou 80% e 100%, os ltimos sendo subtrados de 100 antes da transformao.

43

Você também pode gostar