Você está na página 1de 18

Anlise de varincia e planeamento de experincias

Estudo 1 (Kelly Acampora, in Cobb): A fim de estudar o efeito da durao


dos dias no metabolismo, fez-se um estudo com hamsters dourados num
laboratrio. Cada um de oito hamsters foi colocado aleatoriamente numa de
duas condies, dias longos ou dias curtos. No final do estudo foi-lhes
medida a concentrao de Na+K+ATP-ase no corao (mg/ml) uma
enzima que toma parte na reao bioqumica que transmite os impulsos
nervosos, chamada bomba de sdio.

Estudo 2: Os cientistas identificaram trs tipos de sono, que podem ser


distinguidos pelas ondas cerebrais que ocorrem: LSWS (light slow-wave
sleep), DSWS (deep slow-wave sleep) e REMS (rapid eye movement sleep).
A investigao em seres humanos estabeleceu que durante o sono REM
que sonhamos. Num estudo, seis musaranhos das rvores foram observados
nestas trs fases do sono, sendo registado o seu ritmo cardaco, em
batimentos por minuto.

Estudo 3: Para estudar se de dois suplementos alimentares ajudavam a


aumentar a massa muscular, doze culturistas foram divididos em quatro
grupos de trs por sorteio. Cada um dos grupos recebeu uma das
combinaes possveis dos suplementos: Grupo I (40 mg de suplemento
proteico), Grupo II (10 g de suplemento vitamnico), Grupo III (ambos os
suplementos), e Grupo IV (nenhum dos suplementos). No final de estudo,
foi registado o aumento de peso por semana de cada participante na
experincia.

Principais elementos de um plano/delineamento experimental (experimental


design/layout):

1. Varivel dependente ou resposta: varivel quantitativa (geralmente


contnua) que tomada como indicador do fenmeno em estudo.
2. Unidades experimentais: os elementos da populao (pessoas, objetos,
etc.) em que medida a resposta. Cada unidade produz uma resposta.
3. Varivel ou variveis independentes (condies, fatores*, grupos ou
tratamentos*): variveis qualitativas que podem influir na resposta, e cujo
efeito se pretende conhecer.

Quando o nmero de observaes (unidades experimentais) igual para


todas as combinaes das condies, diz-se que o plano experimental
equilibrado.

Aleatorizadas
Controladas pelo investigador
Experincia*

No aleatorizadas

Condies
No controladas (apenas observadas)
Estudo observacional
* comum reservar os termos fator, tratamento e experincia para
estudos em que as condies so controladas.

Muitas vezes vm-me pedir um diagnstico, quando j s possvel fazer


uma autpsia.
atribudo a Ronald Fisher

Princpio do planeamento de experincias: Controle tudo o que puder, e


aleatorize o que no for possvel controlar.
2

Estudo 1 (Hamsters, simplificado): um plano fatorial simples/ a um fator


aleatorizado, ou plano completamente aleatorizado (one-way layout).

Dias longos
Dias curtos
1
hamster
resposta
hamster
resposta1
n. 4
1,490
3
1,385
n. 1
1,525
8
1,485
7
1,555
5
1,255
2
1,790
6
1,285
1
+ +
Concentrao de Na K ATP-ase no corao (mg/ml)
mdias de grupo:
1 =1,5900
2 =1,3525
mdia global: =1,4713
Decomposio: anlise de varincia simples/ a um fator (one-way
ANOVA):

1,490
1,525
1,555
1,790

1,385
1,4713 1,4713
0,1188 -0,1188
-0,1000 0,0325
1,485 = 1,4713 1,4713 + 0,1188 -0,1188 + -0,0650 0,1325
1,255
1,4713 1,4713
0,1188 -0,1188
1,285
1,4713 1,4713
0,1188 -0,1188

Estudo 2 (Sono): um plano em blocos simples completo (basic complete


block design).
condio (fase do sono)a
musaranho LSWS DSWS REMS
mdia
I
14,0
11,7
15,7
13,8
II
25,8
21,1
21,5
22,8
III
20,8
19,7
18,3
19,6
IV
19,0
18,2
17,1
18,1
V
26,0
23,2
22,5
23,9
VI
20,4
20,7
18,9
20,0
mdia
21,0
19,1
19,0
mdia global:
19,7
a
resposta: ritmo cardaco em batimentos por minuto
Decomposio: anlise de varincia em blocos:
observaes
14,0 11,7 15,7
25,8 21,1 21,5
20,8 19,7 18,3
19,0 18,2 17,1
26,0 23,2 22,5
20,4 20,7 18,9

mdia global

19,7

efeitos da condio

1,3

efeitos dos blocos


-5,9
3,1
-0,1
-1,6
4,2
0,3

-0,6

-0,7

resduos
-1,1 -1,5
1,7
-1,1
-0,1
0,7
-0,4
0,7
0,8
-0,1
-0,9
1,3

2,6
-0,6
-0,6
-0,3
-0,7
-0,4

Tabela da anlise de varincia para o plano em blocos:


Fonte de variao
SQ
Mdia global
6985,62
Condio (fase do sono)
15,24
Blocos (musaranhos)
194,16
Erro (resduos)
20,08
Total (corrigido)
229,48

g.l.

MQ

Estudo 3 (Suplementos): um plano fatorial duplo (two-way layout).


suplemento vitamnico
0
10 g
0,87
0,57
0
0,79
0,52
suplemento
0,65
0,53
proteico
0,86
0,92
40 mg
0,69
1,00
0,79
0,99
mdias de coluna: 1 = 0,78 2 = 0,76
mdia global:

mdias
de linha:
1 = 0,66

2 = 0,88

= 0,77

mdias de clula:
0
s. vit.
0

11 = 0,77 12 = 0,54

s. prot. 21 = 0,78 22 = 0,97

Decomposio: anlise de varincia dupla/a dois fatores (two-way


ANOVA):
observaes
0,87
0,57
0,79
0,52
0,65
0,53
0,86
0,92
0,69
1,00
0,79
0,99

mdia
global

suplemento
proteico

suplemento
vitamnico

-0,110
=

0,765

0,010

-0,010

0,110

0,105

-0,105

+
-0,105

0,105

resduos
0,100
0,030
0,020
-0,020
-0,120
-0,010
0,080
-0,050
-0,090
0,030
0,010
0,020
5

Tabela da anlise de varincia para o plano fatorial duplo:


Fonte de variao
Mdia global
S. Proteico
S. Vitamnico
Interao
Erro
Total

SQ
7,0227
0,1452
0,0012
0,1323
0,0446
7,346

g.l.
1
1
1
1
8
11

MQ

0,1452 26,045 0,0009


0,0012 0,215 0,6550
0,1323 23,731 0,0012
0,0056

Fatores fixos e aleatrios

Num plano experimental, diz-se que um fator fixo quando os seus nveis
tm interesse em si mesmos. Os efeitos dos fatores fixos consideram-se
constantes em cada nvel (todos nulos, se no houver diferenas).
Exemplo: Escolhemos as trs maiores escolas secundrias da regio, para
comparar as mdias obtidas pelos alunos dessas escolas nos exames
nacionais.
Diz-se que um fator aleatrio quando cada um dos seus nveis um
representante de um conjunto maior de nveis possveis ou seja, os nveis
observados so s uma amostra dos nveis de interesse. Os efeitos de um
fator aleatrio consideram-se variveis aleatrias (de valor mdio nulo, e
com varincia tambm nula se no houver diferenas).
Exemplo: Para comparar as mdias obtidas pelos alunos nos exames
nacionais em escolas de diferentes regies do pas, escolhe-se ao acaso uma
escola na regio norte, uma escola na regio centro e uma escola na regio
sul.

Cinco regras, imperfeitas mas teis (Cobb, pp. 561 562):


1. As unidades amostrais devem sempre ser aleatrias.
Ex.: No estudo sobre o efeito da durao do dia, os oito hamsters eram
apenas uma amostra de todos os conjuntos de oito hamsters que se podiam
ter estudado.
2. Os blocos geralmente so aleatrios.
Ex.: No estudo sobre as fases do sono, os seis musaranhos estudados
poderiam ser substitudos por uma amostra aleatria de outros seis
musaranhos quaisquer.
3. Os fatores perturbadores geralmente so aleatrios.
Ex.: o caso dos musaranhos no estudo das fases do sono.
4. Os fatores encaixados (interiores a outros) so geralmente aleatrios.
5. Fatores de interesse que sejam controlados so geralmente fixos.

Uma combinao de nveis de todos os fatores diz-se uma clula do


plano experimental. (Informalmente, pode-se dizer grupo com o
mesmo sentido.)
Para estudar uma interao num plano fatorial, necessrio haver
rplicas observaes mltiplas em cada clula do planeamento.
Caso contrrio, a interao confunde-se com o erro.
Diz-se que um plano experimental equilibrado quando inclui o
mesmo nmero de observaes por clula. Por exemplo, no problema
dos suplementos o plano equilibrado, com 3 observaes (ou
rplicas) por clula.
Ex.: No problema da Pneumologia, o plano no equilibrado
quando se consideram os fatores sexo e consumo, pois o nmero
de pacientes varia entre os sexos, e entre nveis de consumo.

Vantagens dos planos equilibrados, no caso da anlise de varincia simples:


So mais sensveis a diferenas entre as mdias dos grupos (maior
potncia).
So menos sensveis condio de homogeneidade das varincias
(maior robustez).

Fatores cruzados, encaixados e confundidos


Num plano experimental, diz-se que dois fatores estruturais esto
cruzados (crossed) quando cada nvel de um ocorre com cada nvel
do outro.
Diz-se que dois fatores estruturais esto confundidos (confounded)
quando cada nvel de um ocorre com apenas um nvel do outro.
Diz-se que o fator estrutural II est encaixado (nested) no fator
estrutural I quando os nveis de I ocorrem com mais de um nvel de II,
mas cada nvel de II ocorre em apenas um nvel de I.

A experincia de Kelly Acampora

Objetivo genrico: Estudar o efeito das alteraes ambientais sobre o


metabolismo.

Resposta/varivel dependente (indicador da atividade metablica):


concentrao de Na+K+ATP-ase (mg/ml), uma enzima que toma parte na
reao bioqumica que transmite os impulsos nervosos, chamada bomba de
sdio.
Unidades experimentais: Oito hamsters dourados.
Condies/tratamentos: Durao do dia; dias longos (16 horas de luz e 8
de escurido) vs. dias curtos (8 horas de luz e 16 de escurido), simulados
em laboratrio.

Questo 1 (Dias longos vs. dias curtos): A durao do dia afeta a


concentrao da enzima? Em caso afirmativo, qual a magnitude do
efeito?

Procedimento: Distribuir aleatoriamente os 8 hamsters por dois grupos de 4.


Um grupo submetido a um regime de dias longos e o outro a um regime de
dias curtos. No fim da experincia mediu-se a concentrao de Na+K+ATPase no corao para cada hamster.
Delineamento experimental: Plano fatorial simples aleatorizado e
equilibrado, com a durao do dia como fator fixo.
Tabela 1 Plano fatorial simples para a experincia de Kelly (dados parciais)

Dias longos
Dias curtos
hamster
resposta
hamster
resposta
a
n. 4
1,490
3
1,385a
n. 1
1,525
8
1,485
7
1,555
5
1,255
2
1,790
6
1,285
a
+ +
Concentrao de Na K ATP-ase no corao (mg/ml)
9

Dificuldade: Kelly sabia que h variaes individuais no metabolismo dos


hamsters. Como estudar o efeito da durao do dia, controlando/ajustando
(descontando) s diferenas entre hamsters?

Soluo: aplicar os diferentes tratamentos a blocos de hamsters semelhantes.

Procedimento possvel: Se os hamsters viessem divididos em quatro pares


de irmos da mesma ninhada, 1 com 2, 3 com 4, 5 com 6 e 7 com 8, podiase colocar aleatoriamente um elemento de cada par nos dias longos e outro
nos dias curtos. O plano experimental teria a estrutura seguinte:

Tabela 2 - Um plano em blocos aleatorizado para a experincia de Kelly (fictcio)

Ninhada
A
B
C
D

Dias longos
hamster
resposta
n. 1
?
n. 4
?
5
?
8
?

Dias curtos
hamster
resposta
2
?
3
?
6
?
7
?

Unidades experimentais: Hamsters (8 ao todo).


Tratamentos (fator de interesse): Dias longos e dias curtos.
Blocos (fator de confundimento, ou fator perturbador): Ninhada (4 ao
todo), com um par de hamsters por nvel.
Delineamento experimental: Plano em blocos completo aleatorizado, com
as ninhadas como blocos.

Permite responder a mais uma questo:


Questo 2 (Hamsters): A variabilidade de hamster para hamster
suficientemente grande para ser detetada? Em caso afirmativo, quanta
variabilidade existe?

10

Crtica: A ideia boa, mas era improvvel os hamsters virem em ninhadas


de dois.
Na realidade, como comum em biologia, os oito hamsters usados por Kelly
eram todos da mesma ninhada.

Outras ideias para formar blocos:


1. Pesar os hamsters no incio da experincia e emparelh-los com base no
peso (os dois hamsters mais pesados no par A, os dois seguintes no par B,
etc.), aleatorizando depois os tratamentos dentro de cada par.
Crtica: Menos bom. No h razo para pensar que o peso do hamster esteja
relacionada com a concentrao da enzima. Alm disso, o peso pode variar
durante a experincia.
2. Em vez de pesar os hamsters, emparelh-los com base na taxa de consumo
de oxignio.
Crtica: S seria vantajoso se a taxa de consumo de oxignio estivesse
relacionada com a concentrao da enzima.

Se o critrio usado tiver um grande impacto na resposta, considerar blocos


pode aumentar substancialmente a potncia (sensibilidade s diferenas
entre tratamentos) da anlise de varincia. Mas nem sempre vivel.

Entretanto, Kelly foi mais ambiciosa. Aproveitou para medir a concentrao


de Na+K+ATP-ase no crebro dos hamsters dourados, e quis estudar as
diferenas entre os dois rgos:

Questo 3 (Corao vs. crebro): Coraes e crebros tm concentraes


de Na+K+ATP-ase diferentes? Qual a concentrao mdia de enzima
para cada rgo, e quanto vale a diferena entre os dois rgos?

Questo 4 (Interao com a durao do dia): O efeito da durao do dia


igual no corao e no crebro?
11

Procedimento possvel: Repartir os hamsters aleatoriamente por 4 grupos,


I dias longos, medio no corao
II dias longos, medio no crebro
III dias curtos, medio no corao
IV dias curtos, medio no crebro.
Delineamento experimental: plano fatorial duplo aleatorizado.

Unidades experimentais: Hamsters, 8 distribudos por 4 grupos de 2.


Fator de interesse 1 (fixo, aleatorizado): Durao do dia, com 2 nveis
(longos ou curtos).
Fator de interesse 2 (fixo, aleatorizado): rgo, com 2 nveis (crebro ou
corao).

Tabela 3 - Um plano fatorial duplo para a experincia de Kelly (dados parciais)

Hamster
1
2
3
4
5
6
7
8

Grupo
III
I
II
III
II
IV
I
IV

Dias
Longos
Longos
Curtos
Longos
Curtos
Curtos
Longos
Curtos

Corao

1,790
1,385

1,255

1,555

Crebro
10,375

6,625

13,225

11,625

Crticas:
ineficiente: podia-se ter medido ambos os rgos para cada hamster.
No leva em conta as diferenas entre hamsters.

12

A verdadeira experincia de Kelly Acampora (Mount Holyoke College):

Hamster Corao Crebro


4
1,490
6,625
Dias
1
1,525 10,375
longos
7
1,555
9,900
2
1,790
8,800
3
1,385 12,500
Dias
8
1,485 11,625
curtos
5
1,255 18,275
6
1,285 13,225
Procedimento: Atribuiu ao acaso os dias longos a 4 hamsters, e os dias curtos
aos outros 4. Mediu cada hamster duas vezes, uma para obter a concentrao
de enzima no corao, e uma para a concentrao no crebro.

Delineamento: plano em lotes repartidos / de medidas repetidas (split plot


/ repeated measures), LR/MR.

13

Fatores e unidades do plano LR/MR


H dois conjuntos de condies a comparar:
dias longos vs. dias curtos
coraes vs. crebros
Todas as combinaes possveis das condies ocorrem, como num
planeamento fatorial duplo F[2].
H unidades experimentais de diferentes tamanhos: hamsters e
partes de hamster. Cada unidade maior (hamster) um bloco de
unidades menores.
Um conjunto de condies (a durao do dia) atribudo s unidades
maiores totalmente ao acaso, como num planeamento fatorial simples
aleatorizado FSA.
O outro conjunto de condies (o rgo) est associado s unidades
menores (partes de hamster), separadamente dentro de cada bloco,
como num planeamento em blocos completo BC.

Utiliza os trs princpios bsicos do planeamento de experincias:

Cruzamento de fatores: durao do dia rgo


Aleatorizao: dias longos vs. dias curtos
Blocos: as partes de hamster associadas a coraes e a crebros vm pragrupadas em blocos, duas partes por hamster.

14

Estrutura de fatores:

1. blocos / indivduos (subjects)


4
1
7
2
3
8
5
6

2. durao do dia (fator entre blocos, ou entre indivduos, between subjects)


longo

curto

3. rgo (fator dentro dos indivduos/blocos, within subjects)

corao crebro

4. interao da durao do dia com o rgo

15

A durao do dia est cruzada com o rgo.


A interao est encaixada quer na durao do dia quer no rgo.
Os blocos/indivduos esto cruzados com o rgo, e encaixados na
durao do dia.

16

Magnitude do efeito (effect size)

A estatstica de teste da anlise de varincia,

fator
variao mdia atribuvel ao fator (sinal)
=
referncia
rudo mdio

mede a importncia do fator considerado, mas vem numa escala que varia
com o nmero de observaes, o nmero de nveis do fator e o planeamento.
til exprimir o impacto de cada fator numa escala mais simples de
interpretar, seja a escala original da resposta ou uma escala normalizada.

Medidas da magnitude do efeito usuais em anlise de varincia:

1. Absolutas (na escala original da resposta): diferenas entre mdias ou


contrastes estimados e respetivos intervalos de confiana,
(estimativa do contraste) quantil (erro padro) ou /2

2. Relativas (numa escala normalizada):


2.1 Diferenas normalizadas: d de Cohen. Exprime a diferena entre um par
de mdias como um mltiplo do desvio padro.
=

diferena entre as mdias


desvio padro

O desvio padro comum pode ser estimado de diversas formas:


a) Tomando o desvio padro estimado num grupo de referncia, 0 (d = delta
de Glass);
b) Tomando a mdia (ponderada, de 2. ordem) dos desvios padres
estimados em todos os grupos, = erro (d = g de Hedges).

17

2.2 Propores/percentagens de variao explicada:


a)
= 2 =

fator variao explicada pelo fator


=
total
variao total

ou seja a proporo da variao total (da resposta) que atribuvel ao fator,


ou explicada pelo fator.

b)
= 2 =

fator
fator + erro

ou seja a proporo de variao atribuvel ao fator, entre a variao que os


restantes fatores estruturais deixam por explicar.
c) Outras medidas semelhantes: mega quadrado (2 ), psilon quadrado
( 2 ), f de Cohen (ver literatura).

18

Você também pode gostar