Você está na página 1de 23

Teste de hipteses de mais de duas mdias Anlise de varincia (ANOVA)

Lembrando: para testar hipteses segundo estratgia de Neyman e Pearson necessrio

1) formular as hipteses estatsticas;

2) fixar a probabilidade do erro tipo I;

3) calcular o tamanho da amostra necessria para detectar uma diferena que se


suspeita existente o que equivalente a fixar a probabilidade do erro tipo II.

4) apresentar a distribuio de probabilidade da estatstica do teste;

5) estabelecer a(s) regio(es) de rejeio e aceitao (regies crticas) do teste;

6) realizar o estudo, ou seja , coletar os dados e calcular a estatstica do teste;

7) confrontar a estatstica observada com a regio crtica;

8) tomar a deciso;

9) elaborar a concluso.

aula 16- Anlise de varincia 1


(ANOVA)
Considerar a situao na qual deseja-se saber se o tipo de gordura produz efeitos diferentes, quanto a
absoro, em doughnouts fritos.

Inicialmente ser apresentada a comparao de duas mdias e, posteriormente, sero comparadas


trs mdias.

Desenho experimental:
So sorteados (aleatoriamente) doughnuts que foram fritos em cada um de dois tipos de gordura.
Quantifica-se a gordura absorvida em cada tipo.

Notao:
Tipo de gordura (fator): tipo 1 e tipo 2 (i=1,2)
Nmero de doughnuts sorteados em cada tipo: 6 (j=1,...,6)

Dados obtidos: quantidade de gordura (g) absorvida por doughnut, segundo tipo de gordura

doughnut Tipo (i)


(j) 1 2
1 78 55
2 91 66
3 97 49
4 82 64
5 85 70
6 77 68
mdia 85 62 73,5

aula 16- Anlise de varincia 2


(ANOVA)
H 0 : 1 2
Hipteses:
H a : 1 2

Fixando-se a probabilidade de erro tipo I:


Nvel de significncia () = 0,05

Para nvel de significncia pr-fixado, define-se as reas de aceitao e rejeio de H0 utilizando-se a


distrbuio F de Snedecor.

Calcula-se a estatstica do teste e compara-se o


valor observado com a rea de rejeio/aceitao 3.5
Density

H0
de H0 para tomada de deciso. 3

2.5

1.5 Aceitao de H0
Rejeio de H0
1

.5

aula 16- Anlise de varincia 3


(ANOVA)
Estatstica do teste

Para a definio da estatstica do teste, parte-se da idia que se as mdias fossem iguais, a mdia do
tipo 1 seria igual media do tipo 2 e estas seriam iguais mdia total. Se isto acontecesse, no
existiria variabilidade.

Assim, na anlise de varincia estuda-se a variabilidade dos dados. A variabilidade total dos dados
decomposta em dois componentes: a variabilidade das observaes dentro de cada tipo (em torno
de suas mdias) e a variabilidade entre tipo (cada mdia em torno da mdia total).

Estrutura geral dos dados

i
Unidade de 1 2
observao
1 X11 X21
2 X12 X22
j j X1j X2j

6 X16 X26
Mdias
X 1. X 2. X ..
no exemplo: n1=6 n2=6 N=12

aula 16- Anlise de varincia 4


(ANOVA)
2

O nmero total de observaes igual a N n1 n 2 ni ;


i 1

A mdia de cada tipo igual a


6 ni

x x ... x16
x
j 1
1j x
j 1
1j

X 1. 11 12
6 6 n1
6 n2

x x ... x26
x
j 1
2j x
j 1
2j

X 2. 21 22
6 6 n2

6 ni

x x ... xi 6
x j 1
ij x
j 1
ij

A mdia de um tipo genrico i igual a X i. i1 i 2


6 6 ni

2 6 2 ni

x11 ... x16 x21 ... x26


xij xij
A mdia geral igual a X .. i 1 j 1
i 1 j 1
66 12 N

aula 16- Anlise de varincia 5


(ANOVA)
Variabilidade dos dados

Chamando-se os tipos de gordura de k; no exemplo k=2, tem-se que o ndice para tipo de gordura (i)
varia de 1 a k (i=1,..,k)

Considerando-se o nmero de unidades de observao (doughnuts) ni, tem-se que o ndice para
unidade (j) varia de 1 a ni. No exemplo, j= 1, 2,...6 para i=1 e j= 1, 2, ...6 para i=2 pois n 1 = n2 = n
= 6 (modelo balanceado).

A variabilidade total dos dados decomposta em duas: variabilidade dentro e variabilidade dentro:

Variao dentro de tipo de gordura

k ni Soma de quadrado dentro (SQD)

ij i.
( x x
i 1 j 1
) 2 Sum of squares within (SQW).
SQD tambm chamada resduo (SQR)

aula 16- Anlise de varincia 6


(ANOVA)
Variao entre tipo

k Soma de quadrado entre (SQE)

i i. ..
n (
i 1
x x ) 2
Sum of squares between (SQB).

Variao total

k ni

ij ..
( x x
i 1 j 1
) 2 Soma de quadrado total (SQT)

SQT=SQE+SQD

aula 16- Anlise de varincia 7


(ANOVA)
Recapitulando-se

X:varivel contnua de interesse

Populaes P1 P2

Mdias 1 2
Varincias 2 2

Deseja-se comparar as mdias mediante o clculo da variabilidade dos dados. necessrio estimar

2 (varincia populacional). Para tanto, divide-se cada soma de quadrados pelo respectivo grau de
liberdade.

Graus de liberdade (nmero de observaes necessrias)

Graus de liberdade dentro = N-k=10

Graus de liberdade entre = k-1=1

Graus de liberdade total = N-1

aula 16- Anlise de varincia 8


(ANOVA)
SQD
Estimador de 2
: se H0 for verdade, 2
nk
SQD
= Quadrado mdio dentro (QMD), tambm chamado quadrado mdio do resduo (QMR)
N k

outro estimador de 2 : se H 0 for verdade,


SQE
2
k 1

SQE
= Quadrado mdio entre (QME), se H0 no for verdade, o valor estimado do quadrado
k 1
1 k
mdio entre ser igual a QME
2
i i. ..
k 1 i1
n ( x x ) 2

aula 16- Anlise de varincia 9


(ANOVA)
Para a realizao do teste confronta-se o QMD e o QME.

QME
Estatstica do teste:
QMD
QME
Se H0 for verdade, 1
QMD
QME
Se H0 no for verdade, 1
QMD

Se H0 for verdade,
QME
~ F 1 , 2 onde F a curva F de Snedecor e 1 e 2 so os graus de
QMD
liberdade do numerador e denominador, respectivamente

aula 16- Anlise de varincia 10


(ANOVA)
Tabela da Anlise de Varincia ANOVA
Fonte de gl SQ QM F
variao
Entre k-1 SQE SQE QME
QME
k 1 QMD
Dentro N-k SQD SQD
QMD
N k
Total N-1 SQT

Frmulas operacionais:

T2
SQT = X ij , onde T X ij
2

i j N i j

SQD = T 2 T X ij
i , onde i
i j X ij i ni
2
j

Ti 2 T 2
SQE = i ni
N

aula 16- Anlise de varincia 11


(ANOVA)
Aplicao:
Hipteses: H 0 : 1 2
H a : 1 2

Gramas de gordura absorvida por doughnut, segundo tipo de gordura; k=2; N=12

doughnut Tipo de gordura (i)


j 1 2
1 78 55
2 91 66
3 97 49
4 82 64
5 85 70
6 77 68
ni 6 6 N=12
Mdias ( X i. ) 85 62 73,5

Ti 510 372 T = 882

X ij2
j
43652 23402
X 67054
i j
2
ij

T12 5102 T22 372 2 T 2 882 2


Ti 2 43350 23064 64827
n1 6 n2 6 N 12
ni

aula 16- Anlise de varincia 12


(ANOVA)
2
Soma de quadrado entre: SQE = T T2
i n i
i

N
SQE = 43350 23064 64827 1587

Ti 2
Soma de quadrado dentro SQD X n 2
ij
i j i i

SQD = 67054-(43350+23064)=640

2
T
Soma de quadrado totalSQT = X ij2
i j N
SQT = 67054-64827= 2227

aula 16- Anlise de varincia 13


(ANOVA)
ANOVA (N=12; k=2)
Fonte de gl SQ QM F
variao
Entre k-1=1 1587 1587/1= 1587 1587/64 = 24,80
Dentro N-k=10 640 640/10 = 64
Total N-1=11 2227

Para nvel de significncia de 5% e gl = 1 no numerador e 10 no denominador, tem-se a rea de


Density
rejeio/aceitao de H0, se H0 for verdade: 3.5
H0
3

Como o valor de Fobs (24,8) cai na rea de 2.5

rejeio, decide-se por rejeitar H0. 2

1.5 Aceitao de H0 Rejeio de H0


=0,05
Foi encontrada diferena estatisticamente 1

significante entre as mdias, para nvel de .5

significncia de 5%. 0

Fcritico, 1, 10 = 4,96 Fobs=24,8


Os doughnuts ficam encharcados diferentemente segundo o tipo de gordura. O tipo 1 encharca mais
que o tipo 2.

aula 16- Anlise de varincia 14


(ANOVA)
Abordagem de Fisher
Proposio inicial: 1 2
Clculo do valor de p

A probabilidade de se observar um valor F=24,8 ou um


H0
valor mais extremo em uma curva onde as mdias so
iguais < 0,5% (p<0,005). Como o valor de p
pequeno, diz-se que existe evidncia contrria
p<0,005
proposio inicial de igualdade de mdias. O tipo 1
encharca mais os doughnuts que o tipo 2.
Fobs = 24,8

Curva F com 1 e 10 graus de liberdade sob a


hiptese (H0) de igualdade de mdias

aula 16- Anlise de varincia 15


(ANOVA)
A Anlise de varincia equivalente ao teste t de Student para amostras independentes, se o nmero
de tratamentos for igual a 2.

x1 x2 23 ;
x 85
2
302
s12 60,40
1j

j 5 5
x 62
2
338
s 67,60
2 2j
2
j 5 5
60,40 x 5 67,60x 5
s 2p 64
10
x1 x2
t ; t ~ t n1 n2 2 ; t 23
4,9796 ;
1 1 1 1
sp 8 ( )
n1 n2 6 6

note que tn2 n 2 F[1, ( n n 2 )]


1 2 1 2
utilizando-se os dados, 4,97962 24,80

aula 16- Anlise de varincia 16


(ANOVA)
Situao para mais de duas mdias

Abordagem de Neyman e Pearson

Hipteses:
H 0 : 1 2 3
H a : pelo menos uma mdia diferente

Gramas de gordura absorvidas por doughnuts, segundo tipo de gordura, k=3; n=17
Tipo
doughnuts 1 2 3
1 78 55 75
2 91 66 93
3 97 49 78
4 82 64 71
5 85 70 63
6 77 68

ni n1=6 n2=6 n3=5 n=17


Ti T1=510 T2=372 T3=380 T=1262
Xi 85 62 76 74,24

X
j
2
ij 43652 23402 29368 96422

Ti 2 ni 43350 23064 28880 93684,94

aula 16- Anlise de varincia 17


(ANOVA)
Soma de quadrado entre
Ti 2 T 2
SQE n n 43350 23064 28880 93684,94 1609,06
i i

Soma de quadrado dentro


Ti 2
SQD X n 96422 - (43350 23064 28880) 1128
2
ij
i j i i

Soma de quadrdo total


T2
SQT X ij n 96422 - 93684,94 2737,06
2

i j

ANOVA
F. V. g.l. SQ QM F
Entre 2 1609,06 SQEntre/2 = 804,53 QME/QMD= 9,99
Dentro 14 1128 SQDentro/14 = 80,57
Total 16 2737,06

aula 16- Anlise de varincia 18


(ANOVA)
Para nvel de significncia de 5% e gl = 2 no numerador e 14 no denominador, tem-se a rea de
Density
rejeio/aceitao de H0, se H0 for verdade: 3.5
H0
3

Como o valor de Fobs (9,99) cai na rea de 2.5

rejeio, decide-se por rejeitar H0. 2

1.5 Aceitao de H0 Rejeio de H0


=0,05
Foi encontrada diferena estatisticamente 1

significante entre as mdias, para nvel de .5

significncia de 5%. 0

Fcritico, 2, 14 = 3,74 Fobs=9,99

Os doughnuts ficam encharcados diferentemente segundo o tipo de gordura. No possvel afirmar


qual gordura encharca mais, mas pode-se afirmar que as quantidades mdias diferem. Para localizar a
diferenca deve-se utilizar algum tipo de contraste, como por exemplo o de Scheff.

aula 16- Anlise de varincia 19


(ANOVA)
Abordagem de Fisher
Proposio inicial: 1 2 3
Clculo do valor de p:

A probabilidade de se observar um valor F=9,99 ou um H0

valor mais extremo em uma curva onde as mdias so


iguais < 0,5% (p<0,005). Como o valor de p
pequeno, diz-se que existe evidncia contrria p<0,005

proposio inicial de igualdade de mdias. Existe pelo


menos uma mdia diferente. Fobs = 9,99

Curva F com 2 e 14 graus de liberdade sob a


hiptese (H0) de igualdade de mdias

aula 16- Anlise de varincia 20


(ANOVA)
COMPARAES MLTIPLAS - TCNICA DE SCHEFF

Contraste : so valores que multiplicam as mdias de modo formam uma combinao algbrica do

tipo 1 2 . Neste caso, a combinao (1)1 (1)2 . Os valores +1 e 1 constituem os


contrastes c1 e c2 que somados resultam no valor zero.

Utiliza-se os contrastes para compor combinaes (lineares) do tipo c


i
i i
, tal que c 0
i
i

As comparaes podem ser feitas pelos Intervalos de Confiana de 95% (IC95%) para as
combinaes. Se o IC95% incluir o zero, ento as mdias so iguais.

Clculo do IC95%:

ci2
i ci X i S QMDentro( 1 ) , onde S (k 1) F( k 1,N k , )
ni

aula 16- Anlise de varincia 21


(ANOVA)
Comparaes mltiplas 2 a 2:

Mdia 1 x Mdia 2
1 1
(85 62) 2x3,74 80,5714( )
6 6
23 2,73x5,18 ; 23 14,14; (8,86 37,14)

O intervalo no inclui o valor 0, portanto existe diferena entre as mdias.

Mdia 1 x Mdia 3
1 1
(85 76) 2 x3,74 80,5714( )
6 5
9 2,73x5,44 ; 9 14,85; (5,85 23,85)

O intervalo inclui o valor 0, portanto no existe diferena entre as mdias.

Mdia 2 x Mdia 3
1 1
(76 62) 2x3,74 80,5714( )
6 5
14 2,73x5,44 ; 14 14,85; ( 0,85 28,85)

O intervalo inclui o valor 0, portanto no existe diferena entre as mdias.

aula 16- Anlise de varincia 22


(ANOVA)
Exemplo

36 pacientes hospitalizados foram submetidos a trs dietas especiais. Medidas do cido ascrbico no
plasma foram tomadas. Realize um teste de hipteses para investigar se os dados sugerem algum
efeito de dieta.
Dieta 1 Dieta2 Dieta 3
0,22
0,88
1,03
0,96
0,75
0,98
X
i j
2
ij 37,318 ;
0,73 1,18 1,07
0,30 0,74 1,48
0,54 1,33 1,30 T 2 1125,603
0,16 1,27 1,39
0,30 1,17 1,17
0,70 1,80 1,60
Ti 2
0,31
1,40
0,54
1,40
0,77
1,12 i n 33,656
0,60 0,80 1,16 i
0,73 0,50 1,17

aula 16- Anlise de varincia 23


(ANOVA)

Você também pode gostar