Você está na página 1de 46

M. Sal om Cabr al .

FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.1
5. Pr essupost os da ANOVA.
5.1 Pressupostos
5.2 Mtodos Empricos de Diagnstico
5.3 Testes Estatsticos para a Homogeneidade das Varincias
5.4 Transformaes.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.2
Amostragemcasual - a experincia ou as amostras
seleccionadas foram aleatorizadas.
Independncia - os erros so independentes.
Homogeneidade das varincias - os erros tm
a mesma varincia.
Normalidade - os erros seguem uma
distribuio normal.
Aditividade - os efeitos dos tratamentos, dos gradientes
ambientais, etc. so aditivos.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.3
Os resduos so a base das ferramentas de diagnstico
utilizadas para verificar a adequao dos pressupostos de um
modelo linear e so calculados atravs da expresso:
j ij j ij ij
y y y e
.

= =
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.4
Mt odos Empr i c os de Di agnst i c o
1. Verificao do tamanho dos resduos e qual a sua relao com as
outras variveis.
2. o pressuposto da distribuio normal dos resduos avaliado
atravs
(i) do papel de probabilidades da normal
A falta acentuada de ajustamento dos pontos recta indica a
no existncia de normalidade dos resduos.
(ii) da caixa de bigodes dos resduos.
Devemos ter uma caixa de bigodes simtrica com uma mediana
central e uns bigodes ligeiramente maiores que a amplitude
inter-quartil. Se tal no se verificar indica a no existncia de
normalidade dos resduos.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.5
Papel de Probabilidades da normal que consiste em:
1. ordenar os resduos por ordem crescente
2. associar a cada resduo o quantil da normal standard
(Bloom 1958, usado no R)
3. representar graficamente vs e ajustar uma recta (no
R a recta passa pelo 1 e 3 quartis)
A falta acentuada de ajustamento dos pontos recta indica a
no existncia de normalidade dos resduos.
|
.
|

\
|
+
u =

1/4 N
3/8 - i
1
) (i
z
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.6
3. O pressuposto da homogeneidade das varincias
avaliado atravs de um grfico:
(i) dos resduos-versus-estimativas dos valores mdios dos
tratamentos.
(ii) dos resduos-versus-tratamentos.
(iii) caixa de bigodes.
O aparecimento de padres em forma de cunha nos grficos
(i) ou (ii) indica a no existncia de homogeneidade.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.7
Test es par a a Homogenei dade das Var i nc i as
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.8
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.9
Quando o pressuposto da normalidade falha devemos usar o
Teste de Levene (mediana)
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.10
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.11
Exempl o 5.1 (4.1 c ont ) - Comecemos por calcular os resduos
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.12
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.13
Mt odos Empr i c os de Di agnst i c o
Papel de probabilidades da normal
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.14
Figura 1 - Papel de probabilidades da normal para os resduos.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.15
Figura 2 Caixa de bigodes.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.16
Scatterplot (Exp1.sta 4v*25c)
8 10 12 14 16 18 20 22 24
Predict
-6
-4
-2
0
2
4
6
R
e
s
i
d
u
o
Figura 3 - Grfico dos dos resduos-versus-valores preditos
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.17
Scatterplot (Exp1.sta 4v*25c)
0.5 1.0 1.5 2.0 2.5 3. 0 3.5 4.0 4.5 5.0 5.5
Droga
-6
-4
-2
0
2
4
6
R
e
s
i
d
u
o
Figura 4 - Grfico dos resduos-versus-tratamentos
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.18
Box Plot
Median
25%-75%
Non-Outlier Range
Outliers
Extremes
1 2 3 4 5
Droga
6
8
10
12
14
16
18
20
22
24
26
O
b
s
e
r
v
Figura 5 - Caixa de bigodes
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.19
Da anlise dos grficos:
(i) parece no haver violao da hiptese de normalidade dos
resduos.
(ii) parece haver homogeneidade das varincias.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.20
Como f oi f ei t o o Box -Pl ot ?
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.21
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.22
Test es Est at st i c os par a a I gual dade das Var i nc i as
1. Seleccionar Assumptions+Testes pretendidos
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.23
(ii) Testes Igualdade das Varincias
Bartlett
Levene
No rejeitada a hiptese de homogeneidade das varincias (p-
values>0.10).
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.24
Tr ansf or ma es
Se os pressupostos para uma anlise de varincia no so satisfeitos
existem duas alternativas que se podem utilizar para tentar resolver o
problema:
(i) Transformar a varivel que se est a analisar, atravs de uma
funo matemtica, de modo que a varivel transformada
resultante verifique as condies necessrias para conferir
validade ANOVA .
(ii) Aplicar um teste diferente que no exija que os pressupostos que
falharam se verifiquem, tal como os testes no-paramtricos;
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.25
1. Frequentemente vrias falhas dos pressupostos da ANOVA so
tratados simultaneamente pela mesma transformao.
2. Quando transformamos dados, os testes de significncia so feitos
sobre os dados transformados.
3. Quando aplicamos uma transformao, fazem-se as anlises e todas
as inferncias na escala transformada mas as estimativas dos valores
mdios dos tratamentos, normalmente, so apresentadas na escala
original, sendo obtidas a partir das mdias dos dados transformados
por transformao inversa.
O afastamento dos pressupostos da anlise de varincia pode
ser rectificado atravs da transformao dos dados originais
para uma nova escala.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.26
4. Se a transformao no linear, os intervalos de confiana
calculados na escala transformada e alterados depois para a
escala original sero assimtricos. Assim, devemos apresentar
apenas os intervalos de confiana do valor mdio,
transformados inversamente.
5. Os testes F da ANOVA so robustos para assegurar a sua
validade mesmo quando os dados se desviam dos pressupostos
de forma no acentuada.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.27
Tr ansf or ma es-Pot nc i a par a Homogenei zar as
Var i nc i as
(i) A distribuio subjacente aos dados no conhecida
Grfico de Disperso-versus-Nvel+Transformao Potncia
Utilizamos o grfico de disperso-versus-nvel para encontrar o
expoente de uma transformao-potncia. O objectivo eliminar
a correlao existente entre a disperso e o nvel.
o o
|
i i
= com o = constante de proporcionalidade.
( ) ( ) ( )
log log log o o |
i i
= +
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.28
Temos uma relao linear entre e .
O grfico de -versus- ser uma recta com
ordenada na origem e declive |.
Substituindo, na equao o
i
e
i
pelas estimativas e ,
podemos obter uma estimativa de | atravs de uma simples
anlise de regresso linear.
O valor de p para uma transformao que torne homogneas
as varincias pode ser obtido atravs da expresso:
( )
log o
i
( )
log
i
( )
log o
i
( )
log
i
|

1 = p com = declive estimado da equao

|
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.29
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.30
(ii) A distribuio subjacente aos dados conhecida
1- Transformao Raiz Quadrada
Os dados seguem uma distribuio de Poisson
2
1
*
+ = Y Y
2- Transformao Angular ou Arcoseno
As observaes seguem uma distribuio binomial, ou seja,
quando os dados so percentagens ou propores.
p arcsen

= u
com , onde: y - nmero de sucessos
n - nmero de provas independentes.
n
y
p =
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.31
3- Transformao Logartmica
( ) 1 log
*
+ = Y Y
Os dados seguem uma distribuio binomial negativa com
valor esperado e varincia .
Y

2 2 2
Y Y Y
o + =
Obser va es:
1- A transformao logartmica, , uma das mais
utilizadas. Os logaritmos na base 10 so os mais usados mas
qualquer base satisfatria.
Y Y log
*
=
2- Quando alguns dos valores observados, Y, so pequenos e,
eventualmente, zero recomenda-se a transformao:
( ) 1 log
*
+ = Y Y
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.32
Ex empl o 5.2- Um ensaio com microssomas de salmonela foi
usado para investigar o potencial de substncias txicas
ambientais na sua capacidade de provocarem alteraes
hereditrias no material gentico. O composto 4NoP (4-nitro-
orto-fenilenediamina) foi testado com estirpes da Salmonella
TA98. O nmero de colnias visveis em placas doseadas com
4NoP foi contado. Foram usadas 5 doses. O nmero de colnias
para sete das placas de cada dose encontra-se na tabela.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.33
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.34
Resol u o:
Figura 5 - Caixa de bigodes
Figura 6 - Papel de probabilidades
Box Plot
Median
25%-75%
Non-Outlier Range
1 2 3 4 5
Dose
-100
0
100
200
300
400
500
600
700
800
900
C
o
n
t
a
g
e
m
P-Plot: Contagem
Effect: Dose
(Plot of within-cell residuals)
-140 -120 -100 -80 -60 -40 -20 0 20 40 60 80 100 120
Observed Value
-4
-3
-2
-1
0
1
2
3
E
x
p
e
c
t
e
d

N
o
r
m
a
l

V
a
l
u
e
All Groups
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.35
(i) Atravs do box-plot somos levados a concluir que no h
igualdade nas varincias o que confirmado pelo teste de Levene.
(ii) O papel de probabilidades tambm indica que o pressuposto
de normalidade violado.
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.36
Grfico de Disperso-versus-Nvel
A estimativa de 0.7724 ento p=1-0.7724=0.2276 usar a
transformao logartmica
|

) 1 log( + = x y
lsd =-0.7352+0.7724*x
2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0
lm(x)
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
l
s
d
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.37
O box-plot dos dados transformados deixa concluir que existe
homogeneidade entre as varncias o que confirmado pelo teste
de Levene.
Box Plot
Median
25%-75%
Non-Outlier Range
1 2 3 4 5
Dose
2.0
2.5
3.0
3.5
4.0
4.5
5.0
5.5
6.0
6.5
7.0
L
o
g
(
C
o
n
t
a
g
e
m
+
1
)
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.38
O papel de probabilidades no nos leva a rejeitar a hiptese de
normalidade dos dados
P-Plot: Lcontagem: =log(contagem+1)
Effect: Dose
(Plot of within-cell residuals)
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5
Observed Value
-3
-2
-1
0
1
2
3
E
x
p
e
c
t
e
d

N
o
r
m
a
l

V
a
l
u
e
All Groups
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.39
A tabela da ANOVA :
interessante notar que tratando-se de contagens a transformao
indicada , no entanto, . Acontece que os autores do
artigo onde se encontram estes dados (JASA, 84, 651-661) sugerem
que a distribuio binomial negativa ser a distribuio plausvel para
os dados pelo que aquela transformao (Bartlett, 1947) a indicada.
) 1 log( + = x y
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.40
Obser va es
Limitmo-nos a considerar os resduos dados por
no entanto, estes resduos tm algumas desvantagens :
resduos no mesmo tratamento no so independentes uns
dos outros;
no caso do planeamento no ser equilibrado as varincias dos
resduos so heterogneas de tratamento para tratamento.
j ij j ij ij
y y y e
.

= =
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.41
A no independncia no pode ser corrigida mas a
heterogeneidade das varincias pode utilizando-se os resduos
studentizados dados por
) 1 (

~
ij E
ij
ij
h MS
e
e

=
onde a diagonal da matriz
ij
h
( )
1
X X X X H

=
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.42
Normal Prob. Plot; Studentized residuals
Dependent variable: Observ
(Analysis sample)
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5
Residual
-3.0
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
E
x
p
e
c
t
e
d

N
o
r
m
a
l

V
a
l
u
e
.01
.05
.15
.35
.55
.75
.95
.99
Exempl o 1 (c ont )
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.43
No caso do nosso exemplo a utilizao dos resduos studentizados
para a construo do grfico do papel de probabilidades levou-
nos s mesmas concluses.
Este tipo de resduos so utilizados na anlise de outliers. Mais
pormenores sobre a anlise de resduos pode ser encontrada em
Drapper e Smith (1980).
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.44
> - 2. 8/ sqr t ( 8. 06)
[ 1] - 0. 986258
standardizado
> - 2. 8/ sqr t ( 8. 06*( 1- 0. 2) )
[ 1] - 1. 10267 studentizado
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.45
Como posso calcular o leverage?
> x1<-rep(1,25)
> x2<-c(rep(1,5),rep(0,20))
> x3<-c(rep(0,5),rep(1,5),rep(0,15))
> x4<-c(rep(0,10),rep(1,5),rep(0,10))
> x5<-c(rep(0,15),rep(1,5),rep(0,5))
> x<-cbind(x1,x2,x3,x4,x5)
> X<-as.matrix(x)
> Xt<-t(X)
> Y<-solve(Xt%*%X)
> diag(X%*%Y%*%Xt)
[1] 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2
0.2 0.2 0.2 0.2 0.2 0.2 0.2
[20] 0.2 0.2 0.2 0.2 0.2 0.2
M. Sal om Cabr al . FCUL
Anl i se de Var i nc i a e Pl aneament o de Ex per i nc i as
Capt ul o 5.46
O que f azer quando no c onsegui mos a t r ansf or ma o
adequada?
1- Usar um teste no-paramtrico que neste caso o KruskalWallis.
2- Usar um mtodo computacional intensivo.
3- No caso dos dados serem:
(i)0s e 1s
(ii)contagens
A utilizao de modelos de regresso adequados para analisar os
dados recomendada. Regresso Logstica para (i) e Regresso de
Poisson para (ii)

Você também pode gostar