Escolar Documentos
Profissional Documentos
Cultura Documentos
An Ova
An Ova
ANLISE DE VARINCIA
INTRODUO
Exemplos
Para curar uma certa doena existem quatro tratamentos possveis: A, B, C e D. Pretende-se saber se existem diferenas significativas nos tratamentos no que diz respeito ao tempo necessrio para eliminar a doena.
...
Carla Henriques 1
ANLISE DE VARINCIA
Existem k populaes de interesse, nas quais se estuda uma caracterstica comum. Sejam X1, X2, ..., Xk as variveis aleatrias que representam tal caracterstica nas populaes 1, 2, ...,k, respectivamente. Hipteses a testar: H0: 1 = 2 = ... = k H1: i j para algum i e algum j tais que i j. As k populaes podem ser vistas como k nveis de um mesmo factor. A questo saber se o factor exerce alguma influncia na variao da caracterstica em estudo.
Carla Henriques 2
ANLISE DE VARINCIA
Exemplo
Para curar uma certa doena existem quatro tratamentos possveis: A, B, C e D. Pretende-se saber se existem diferenas significativas nos tratamentos no que diz respeito ao tempo necessrio para eliminar a doena. Temos apenas um factor, Tratamento, que se apresenta em quatro nveis, A, B, C e D. Atravs da aplicao da anlise de varincia com um factor ou "one-way ANOVA", podemos indagar se os tratamentos produzem os mesmos resultados no que diz respeito caracterstica em estudo.
Carla Henriques 3
ANLISE DE VARINCIA
Exemplo
Suponhamos agora que existe a suspeita de que uma estao quente um factor determinante para uma cura rpida. Ento, o estudo deve ser conduzido tendo em conta este segundo factor, Estao do Ano. Aqui, a tcnica estatstica apropriada ser a anlise de varincia com dois factores, tambm designada por "two-way ANOVA". Neste caso, pode-se testar se existe diferena entre os tratamentos e tambm se existe diferena entre as estaes do ano, no que respeita ao tempo de tratamento at eliminao da doena.
Carla Henriques 4
ANLISE DE VARINCIA
x = 52
ANLISE DE VARINCIA
Exemplo 1
Representemos por Xi o volume de vendas numa semana na loja i (i = 1,2,3) e por i o valor mdio de Xi. Este exemplo tem apenas um factor de interesse, o factor Loja, e este apresenta trs nveis ou grupos: Loja 1, Loja 2 e Loja 3. Cada nvel do factor define uma populao de mdia i . Pretende-se saber se as mdias dos trs nveis, ou populaes, so iguais, isto , pretende-se saber se de rejeitar ou no a hiptese H0: 1 = 2 = 3 (igualdade de vendas mdias das trs lojas).
Carla Henriques 6
ANLISE DE VARINCIA
Exemplo 1
Questo: Sero as mdias amostrais x1 =49, x2 =56 e x3 =51 diferentes porque h diferenas entre as mdias populacionais 1, 2 e 3 ? Ou sero essas diferenas razoavelmente atribudas a flutuaes amostrais? Podemos ento formular as seguintes hipteses: H0: 1 = 2 = 3 (no h diferena entre o volume mdio de vendas das 3 lojas) (h pelo menos duas lojas com diferentes volumes mdios de vendas) H1: i j para algum i e algum j tais que i j
No seria possvel resolver a questo conduzindo trs testes de hipteses, cada um comparando duas mdias populacionais, utilizando as tcnicas vistas no captulo anterior? Suponhamos que, de facto, as vendas mdias das trs lojas so iguais, isto 1 = 2 = 3 .
Carla Henriques 7 Departamento de Matemtica ESTV
ANLISE DE VARINCIA
Admitindo a independncia entre os trs testes e fixando para cada teste um nvel de significncia de 0.05, o nvel de significncia para o conjunto dos trs testes, isto , a probabilidade de decidirmos erradamente que as trs mdias no so iguais quando de facto o so, seria aproximadamente 0.1426. Pensemos nos 3 testes de hipteses como 3 provas de Bernoulli. Sucesso tomar a deciso errada de rejeitar H0 W n de decises erradas (sucessos) nos trs testes de hipteses W ~ B(3, 0.05) A probabilidade de concluirmos erradamente que as 3 mdias no so iguais, igual a 3 P(W 1) = 1 P(W = 0 ) = 1 0.050 0.953 = 0.1426. 0
Carla Henriques
ANLISE DE VARINCIA
PRESSUPOSTOS
Hiptese de Homocedasticidade.
Carla Henriques
ANLISE DE VARINCIA
flutuaes amostrais.
1 = 2 = 3 =
todas as amostras provm de populaes com mdias iguais. Como se sups que todas as populaes so normais e tm varincias iguais, isto o mesmo que extrair todas as amostras de uma nica populao (de uma nica loja).
Carla Henriques
10
ANLISE DE VARINCIA
As mdias das populaes no so iguais, ou seja pelo menos duas lojas tm volumes de vendas mdios diferentes. As amostras recolhidas provm de populaes diferentes.
Carla Henriques
11
ANLISE DE VARINCIA
Um teste diz-se robusto quando a probabilidade de erro tipo I se mantm inalterada (e prxima do nvel de significncia fixado priori) e/ou a sua potncia mantida em nveis adequados, mesmo que os pressupostos de aplicao no sejam vlidos. Por outras palavras, o teste produz resultados de confiana mesmo quando aplicado em condies diferentes daquelas para que foi deduzido.
Carla Henriques Departamento de Matemtica ESTV
12
ANLISE DE VARINCIA
ESTATSTICA DE TESTE F
A estatstica de teste mede a razo entre a variao entre grupos e a variao dentro dos
grupos:
F=
Carla Henriques
13
ANLISE DE VARINCIA
Dados e Notao
Os dados, usualmente, vm representados da seguinte maneira:
Observaes ( i )
Amostra ( j ) 2 3 ... x12 x13 ... x22 x23 ... x32 x33 ...
M M O
Notao:
k x1k x2k x3k
M
N=
j =1 n j
k k ni j =1i =1
(total de observaes)
Mdias amostrais
x1
x2
x3
...
xk
xij
njxj
=
j =1
x=
n1 + n2 + L + nk
n1 + n2 + L + nk
Carla Henriques
14
ANLISE DE VARINCIA
SSA= n j (x j x )
j =1
a soma de quadrados entre os nveis, ou grupos, do factor e mede a variao entre grupos (populaes); por vezes designada por variao explicada, pois ela explicada pelo facto de as amostras poderem provir de populaes diferentes;
SSE= (xij x j )2
k n j =1i =1
a soma de quadrados dentro dos nveis, ou grupos, do factor e mede a variao dentro dos grupos (populaes); por vezes designada por variao no explicada ou residual, pois atribuda a flutuaes dentro do mesma populao, portanto no pode ser explicada pelas possveis diferenas entre os grupos (populaes).
Carla Henriques
15
ANLISE DE VARINCIA
MSA=
j =1
k 1
k nj
SS A . k 1
SS E MSE = = . n1 + n2 + L + nk k N k
j =1i =1
2 (xij x j )
Carla Henriques
16
ANLISE DE VARINCIA
MS A F= ~ Fkk(1 1) . n MS E H0 deve ser rejeitada se o valor observado de F se situar direita do ponto crtico.
Isto , rejeita-se H0 se,
Fobs pc
onde, o ponto crtico pc dado por
Carla Henriques
17
ANLISE DE VARINCIA
Fonte de Variao
SSE= (xij x j )2
k nj j =1i =1 k nj
Razo F F=
MS A MS E
SST= (xij x )
j =1i =1
N 1
Pode-se provar que SST = SSA+SSE, o que permite verificar os clculos da Tabela ANOVA.
Exemplo 1
Carla Henriques Departamento de Matemtica ESTV
18
ANLISE DE VARINCIA
( xi1 x1 )
i =1 5
i =1 5
( xi 2 x2 )
i =1
( xi 3 x3 )2 = (54 51)2 + (50 51)2 + (51 51)2 + (51 51)2 + (49 51)2 = 14 .
SSE=30+50+14=94
Clculo do SSA= n j (x j x )2
k j =1
Carla Henriques Departamento de Matemtica ESTV
19
ANLISE DE VARINCIA
2 2 2
Apresentamos a seguir a Tabela ANOVA relativa ao Exemplo 1. Fonte de Variao Entre grupos Dentro dos grupos ou residual Total Soma de Quadrados SSA=130 SSE=94 SST=224 Graus de Varincia (Soma Mdia Razo F Liberdade de Quadrados) 2 MSA=130/2=65 65/7.83 =8.3 12 MSE=94/12=7.83 14
Se a hiptese H0 verdadeira, F=
Carla Henriques
MS A 2 ~ F12 . MS E
Departamento de Matemtica ESTV
20
ANLISE DE VARINCIA
Ento a hiptese H0 rejeitada ao nvel de significncia de 0.05, isto , existem diferenas significativas entre as mdias amostrais das vendas. H portanto evidncia de que existem pelo menos duas lojas com volumes mdios de vendas diferentes. Por outras palavras, o factor Loja exerce uma influncia significativa sobre o volume de vendas.
Exemplo 2
Suponha que director de marketing de uma empresa que pretende relanar um produto no mercado. Voc estudou trs campanhas de marketing diferentes, cada uma deles combina de
Carla Henriques Departamento de Matemtica ESTV
21
ANLISE DE VARINCIA
modo diferente factores como o preo do produto, a apresentao do produto, promoes associadas, etc. Qualquer uma destas campanhas levada a cabo no ponto de venda, no havendo qualquer publicidade nos meios de comunicao. Para saber se h diferena entre as trs campanhas relativamente sua eficcia, cada uma delas feita num conjunto de lojas seleccionadas aleatoriamente, durante um perodo de durao limitada. Note que as lojas so seleccionadas de modo a que as trs amostras sejam aleatrias e independentes entre si. As vendas (em unidades monetrias u. m.) registadas durante este perodo constam da tabela seguinte.
Carla Henriques
22
ANLISE DE VARINCIA
Seja Xi a v.a. que representa o volume de vendas de uma loja sujeita campanha i (i=1,2,3). Admitamos que X1, X2 e X3 tm distribuio normal com iguais varincias.
Carla Henriques
23
ANLISE DE VARINCIA
24
ANLISE DE VARINCIA
x3 = 6.3333 e x = 7.611; 44.03 SSA= 44.03 e MSA= = 22.015 ; 2 30.2476 SSE= 30.2476 e MSE= = 2.0165 . 15 x2 = 9.5714 ,
x1 = 6.4 ,
Ao nvel de significncia de 0.01, rejeita-se a hiptese H0 de igualdade de mdias, pois o valor observado da estatstica de teste pertence regio crtica. H, portanto, evidncia estatstica de que as trs campanhas no so iguais relativamente ao volume mdio de vendas a que conduzem. Isto , o tipo de campanha influencia significativamente o volume de vendas.
Carla Henriques
25
ANLISE DE VARINCIA
Fonte de Variao Soma de Quadrados Entre grupos Dentro dos grupos ou residual Total SSA=44.03 SSE=30.247
Graus de Liberdade 2 15
Varincia (Soma Razo F Mdia de Quadrados) MSA= 22.015 10.9174 MSE= 2.0165
SST=74.277
19
Carla Henriques
26
ANLISE DE VARINCIA
Estes testes permitem examinar simultaneamente pares de mdias amostrais para identificar quais os pares onde se registam diferenas significativas.
Carla Henriques Departamento de Matemtica ESTV
27
ANLISE DE VARINCIA
Pressupostos destes testes: 1. As amostras devem ser aleatrias e independentes; 2. As amostras devem ser extradas de populaes normais;
2 3. As populaes devem ter varincias iguais ( 12 = L = k = 2 ) homocedasticidade.
28
ANLISE DE VARINCIA
onde, ST (1 )
(k , N k )
graus de liberdade ST (k , N - k) :
P (W ST (1 ) ) = 1 , W ~ ST (k , N - k) .
Carla Henriques
29
ANLISE DE VARINCIA
[IC](1- )
MS E 1 1 + = (xi x j ) ST ( 1 ) . 2 ni n j
Exemplo 1
x1 x2 = 49 56 = 7 ,
x1 x3 = 49 51 = 2 x2 x3 = 56 51 = 5 Usando um nvel de significncia igual a 0.05, vem:
ST (1 ) =3.77
Carla Henriques
30
ANLISE DE VARINCIA
Como x1 x2 = 7 > 4.718, rejeita-se a hiptese H0:1= 2. Tambm, x2 x3 = 5 > 4.718, logo rejeita-se a hiptese H0:2= 3. Finalmente, como x1 x3 = 2 < 4.718, no se rejeita a hiptese H0:1= 3.
Assim, h evidncia de que a loja 2 tem um volume mdio de vendas diferente das lojas 1 e 3. Isto , a mdia observada para a loja 2 difere significativamente das mdias observadas para as lojas 1 e 3, enquanto que, a diferena registada entre o volume de vendas da loja 1 e da loja 3 no significativa.
Carla Henriques
31
ANLISE DE VARINCIA
TESTE SCHEFF
Neste teste a hiptese nula H0: i = j rejeitada se
1 1 xi x j (k - 1)F(1- ) . MS E + n n j i
k onde, F(1 ) o quantil de probabilidade (1-) da distribuio FN 1 : k k P FN 1 F(1 ) = 1 . k
Intervalo de confiana:
[IC](1- )
1 1 = (xi x j ) (k - 1)F(1- ) . MS E + n n j i
Carla Henriques
32
ANLISE DE VARINCIA
Exemplo 2
x1 x2 = 6.4 9.5714 = 3.1714 x1 x3 = 6.4 6.3333 = 0.0667
x 2 x3 = 9.5714 6.3333 = 3.2318
x1 x 3 = 0.0667< 2 6.36 .
Carla Henriques
33
ANLISE DE VARINCIA
x 2 x 3 = 3.2318 >
2 6.36 .
Assim, ao nvel de significncia de 0.01, h evidncia de que campanha de marketing 2 est associado um volume mdio de vendas diferente dos volumes mdios associados s campanhas 1 e 3. Isto , a mdia observada para a campanha 2 difere significativamente das mdias observadas para as campanhas 1 e 3, enquanto que, a diferena registada entre as campanhas 1 e 3 no significativa.
Carla Henriques
34
ANLISE DE VARINCIA
Teste de Bartlett
Este teste tem como pressuposto que as populaes tenham distribuio normal. Alm disso, s aplicvel quando as diferentes amostras envolvidas tenham dimenses nj no inferiores a quatro ( n j 4 , para todo o j).
Carla Henriques
35
ANLISE DE VARINCIA
( ) (n j 1) ln( ) ~ k21 j =1
k
S2 j
sobH 0
S2 j S2 p
1 n 2 = ( X ij X j ) n j 1 i =1
j
1 = N k
(n j 1) S 2 j
j =1
1 k 1 1 C = 1+ 3(k 1) j =1n j 1 N k Trata-se de um teste unilateral direita: rejeita-se H0 se Bobs 12 , k 1 , onde 12 , k 1 o quantil de probabilidade (1-) da distribuio
k21.
Carla Henriques
36
ANLISE DE VARINCIA
Exemplo 1
Vamos testar a hiptese H0, de igualdade de varincias das trs variveis consideradas, ao nvel de significncia de 0.01. Sob o pressuposto de H0 ser verdadeira,
k 1 2 2 B = ( N k ) ln S p (n j 1) ln S 2 ~ 2 . j C j =1 2 = 9.21 (quantil de probabilidade 0.99 da distribuio 2 )
( )
( )
2 0.99, 2
R.C.= [9.21, +[. Para as amostras recolhidas tem-se, 1 [15 ln(2.0165) 4 ln(1.3) 6 ln(2.95) 5 ln(1.4667)]=0.971 R. C. 1.09167 Ao nvel de significncia de 0.01, no se pode rejeitar a hiptese de que as trs variveis Bobs = populacionais tenham iguais varincias.
Carla Henriques Departamento de Matemtica ESTV
37