Você está na página 1de 37

Dep.

Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

INTRODUÇÃO

Exemplos
9 Para curar uma certa doença existem quatro tratamentos possíveis: A, B, C e D.
Pretende-se saber se existem diferenças significativas nos tratamentos no que diz
respeito ao tempo necessário para eliminar a doença.

9 Comparar três lojas quanto ao volume médio de vendas.

9 ...

Carla Henriques Departamento de Matemática — ESTV


1
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Existem k populações de interesse, nas quais se estuda uma característica comum.

Sejam X1, X2, ..., Xk as variáveis aleatórias que representam tal característica nas
populações 1, 2, ...,k, respectivamente.

Hipóteses a testar:
H0: µ1 = µ2 = ... = µk
H1: µi ≠ µj para algum i e algum j tais que i ≠ j.

As k populações podem ser vistas como k níveis de um mesmo factor.

A questão é saber se o factor exerce alguma influência na variação da característica em


estudo.

Carla Henriques Departamento de Matemática — ESTV


2
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Exemplo
Para curar uma certa doença existem quatro tratamentos possíveis: A, B, C e D.

Pretende-se saber se existem diferenças significativas nos tratamentos no que diz respeito ao
tempo necessário para eliminar a doença.

Temos apenas um factor, Tratamento, que se apresenta em quatro níveis, A, B, C e D.

Através da aplicação da análise de variância com um factor ou "one-way ANOVA",


podemos indagar se os tratamentos produzem os mesmos resultados no que diz respeito à
característica em estudo.

Carla Henriques Departamento de Matemática — ESTV


3
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Exemplo
Suponhamos agora que existe a suspeita de que uma estação quente é um factor determinante
para uma cura rápida.

Então, o estudo deve ser conduzido tendo em conta este segundo factor, Estação do Ano.

Aqui, a técnica estatística apropriada será a análise de variância com dois factores, também
designada por "two-way ANOVA".

Neste caso, pode-se testar se existe diferença entre os tratamentos e também se existe
diferença entre as estações do ano, no que respeita ao tempo de tratamento até à eliminação da
doença.

Carla Henriques Departamento de Matemática — ESTV


4
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

ANÁLISE DE VARIÂNCIA COM UM FACTOR


Exemplo 1
O Sr. Fernando Estradas é dono de várias lojas que vendem todo o tipo de material para
desportos radicais. Ele pretende comparar três lojas quanto ao volume de vendas.
Para isso, para cada loja, ele selecciona aleatoriamente cinco semanas, onde observa o volume
de vendas. Obtém assim uma amostra das vendas semanais para cada loja (as três amostras
são independentes). Os dados estão registados na tabela seguinte.

Loja 1 Loja 2 Loja 3


47 55 54
53 54 50
49 58 51
50 61 51
46 52 49
X i (médias amostrais) x1 = 49 x2 = 56 x3 = 51 x = 52

Carla Henriques Departamento de Matemática — ESTV


5
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Exemplo 1
Representemos por Xi o volume de vendas numa semana na loja i (i = 1,2,3) e por µ i o valor
médio de Xi.

Este exemplo tem apenas um factor de interesse, o factor Loja, e este apresenta três níveis ou
grupos: Loja 1, Loja 2 e Loja 3.

Cada nível do factor define uma população de média µ i .

Pretende-se saber se as médias dos três níveis, ou populações, são iguais, isto é, pretende-se
saber se é de rejeitar ou não a hipótese

H0: µ1 = µ 2 = µ 3 (igualdade de vendas médias das três lojas).

Carla Henriques Departamento de Matemática — ESTV


6
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Exemplo 1
Questão:
Serão as médias amostrais x1 =49, x2 =56 e x3 =51 diferentes porque há diferenças entre
as médias populacionais µ1, µ 2 e µ 3 ?

Ou serão essas diferenças razoavelmente atribuídas a flutuações amostrais?

Podemos então formular as seguintes hipóteses:


H0: µ1 = µ 2 = µ 3 (não há diferença entre o volume médio de vendas das 3 lojas)
H1: µ i ≠ µ j para algum i e algum j tais que i ≠ j (há pelo menos duas lojas com
diferentes volumes médios de vendas)

Não seria possível resolver a questão conduzindo três testes de hipóteses, cada um
comparando duas médias populacionais, utilizando as técnicas vistas no capítulo anterior?
Suponhamos que, de facto, as vendas médias das três lojas são iguais, isto é µ1 = µ 2 = µ 3 .
Carla Henriques Departamento de Matemática — ESTV
7
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Admitindo a independência entre os três testes e fixando para cada teste um nível de
significância de 0.05, o nível de significância para o conjunto dos três testes, isto é, a
probabilidade de decidirmos erradamente que as três médias não são iguais quando de facto o
são, seria aproximadamente 0.1426.

Pensemos nos 3 testes de hipóteses como 3 provas de Bernoulli.


Sucesso ≡ ”tomar a decisão errada de rejeitar H0”
W ≡ ”nº de decisões erradas (sucessos) nos três testes de hipóteses”
W ~ B(3, 0.05)
A probabilidade de concluirmos erradamente que as 3 médias não são iguais, é igual a
⎛ 3⎞
P(W ≥ 1) = 1 − P(W = 0 ) = 1 − ⎜ ⎟ 0.050 0.953 = 0.1426.
⎝ 0⎠

Carla Henriques Departamento de Matemática — ESTV


8
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

PRESSUPOSTOS

A aplicação da análise de variância pressupõe a verificação das seguintes condições:

1. As amostras devem ser aleatórias e independentes.

2. As amostras devem ser extraídas de populações normais.

3. As populações devem ter variâncias iguais (σ 12 = σ 22 = L = σ k2 = σ 2 )

– Hipótese de Homocedasticidade.

Carla Henriques Departamento de Matemática — ESTV


9
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Temos então duas situações possíveis:

¾ H0 é verdadeira − as diferenças observadas entre as médias amostrais são devidas a


flutuações amostrais.

µ1 = µ 2 = µ 3 = µ ⇒ todas as amostras provêm de populações com médias iguais.


Como se supôs que todas as populações são normais e têm
variâncias iguais, isto é o mesmo que extrair todas as amostras
de uma única população (de uma única loja).

µ
Distribuições populacionais quando H0 é verdadeira (µ1=µ2=µ3=µ).

Carla Henriques Departamento de Matemática — ESTV


10
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

¾ H0 é falsa – as diferenças observadas entre as médias amostrais são demasiado grandes para
serem devidas unicamente a flutuações amostrais.

As médias das populações não são iguais, ou seja pelo menos duas lojas têm volumes de
vendas médios diferentes. As amostras recolhidas provêm de populações diferentes.

µ3 µ1 µ2
Distribuições populacionais quando H0 é falsa (as médias não são todas iguais).

Carla Henriques Departamento de Matemática — ESTV


11
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Implicações da não verificação dos pressupostos


Parece ser consensual que:
Violação do pressuposto de normalidade das distribuições populacionais
A ANOVA é robusta1 a desvios da normalidade desde que as amostras não sejam pequenas e as
distribuições populacionais não sejam muito enviesadas nem muito achatadas
Violação do pressuposto de igualdade de variâncias populacionais
A ANOVA é robusta a desvios da homocedasticidade se:
i. as amostras tiverem dimensões semelhantes (o quociente entre a maior e a menor dimensão
amostral é ≤ 1,5);
ii. as amostras não forem muito pequenas (ni≥5)
iii. a razão entre a menor e a maior variância não for muito grande (<1/4).

1
Um teste diz-se robusto quando a probabilidade de erro tipo I se mantém inalterada (e próxima do nível de
significância fixado à priori) e/ou a sua potência é mantida em níveis adequados, mesmo que os pressupostos de
aplicação não sejam válidos. Por outras palavras, o teste produz resultados de confiança mesmo quando aplicado em
condições diferentes daquelas para que foi deduzido.
Carla Henriques Departamento de Matemática — ESTV
12
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

ESTATÍSTICA DE TESTE – F

A estatística de teste mede a razão entre a variação entre grupos e a variação dentro dos
grupos:

Variação entre grupos


F=
Variação dentro dos grupos

A hipótese H0 é pois rejeitada para valores grandes da estatística F.

Carla Henriques Departamento de Matemática — ESTV


13
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Dados e Notação
Os dados, usualmente, vêm representados da seguinte maneira:

Amostra ( j ) Notação:
1 2 3 ... k
x11 x12 x13 ... x1k • k − nº de amostras
Observações ( i ) x21 x22 x23 ... x2k • n j − nº de observações na amostra j
x31 x32 x33 ... x3k
∑ j =1 n j
k
M M M O M • N= (total de observações)

Médias amostrais x1 x2 x3 ... xk x • x j − média observada na amostra j


k ni k
∑ ∑ xij ∑njxj
j =1i =1 j =1
• x= =
n1 + n2 + L + nk n1 + n2 + L + nk
− média ponderada das médias amostrais

Carla Henriques Departamento de Matemática — ESTV


14
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Somas de quadrados

SST= ∑ ∑ (xij − x )2
k n
Æ é a soma de quadrados total e mede a variação total nos dados;
j =1i =1

SSA= ∑ n j (x j − x )
k
2
Æ é a soma de quadrados entre os níveis, ou grupos, do factor e
j =1 mede a variação entre grupos (populações); é por vezes designada
por “variação explicada”, pois ela é explicada pelo facto de as
amostras poderem provir de populações diferentes;

SSE= ∑ ∑ (xij − x j )2 Æ é a soma de quadrados dentro dos níveis, ou grupos, do factor


k n

j =1i =1 e mede a variação dentro dos grupos (populações); é por vezes


designada por “variação não explicada ou residual”, pois é
atribuída a flutuações dentro do mesma população, portanto não
pode ser explicada pelas possíveis diferenças entre os grupos
(populações).

Carla Henriques Departamento de Matemática — ESTV


15
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Somas médias de quadrados

∑ n j (x j − x )
k
2

j =1 SS A Æ Soma média de quadrados entre grupos


MSA= = .
k −1 k −1

∑ ∑ (xij − x j )
k nj
2
j =1i =1 SS E Æ Soma média de quadrados dentro dos
MSE = = . grupos ou residual
n1 + n2 + L + nk − k N − k

Carla Henriques Departamento de Matemática — ESTV


16
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Sob o pressuposto de H0 ser verdadeira, tem-se


MS A
F= ~ Fkk(−n1−1) .
MS E

H0 deve ser rejeitada se o valor observado de F se situar à direita do ponto crítico.


Isto é, rejeita-se H0 se,
Fobs ≥ pc
onde, o ponto crítico pc é dado por

( )
P Fkk(−n1−1) ≥ pc = α = nível de significância.

O ponto crítico pc é o quantil de probabilidade 1-α da distribuição Fkk(−n1−1) e é usualmente

denotado por F(1−α ) ou por F1−α ,k −1,k ( n −1) .

Carla Henriques Departamento de Matemática — ESTV


17
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

TABELA DE ANÁLISE DE VARIÂNCIA (ANOVA)


Os cálculos para a análise de variância podem ser sumariados numa tabela chamada Tabela
ANOVA:

Fonte de Variação Soma de Quadrados Graus de Variância (Soma Razão F


Liberdade Média de Quadrados)

SSA= ∑ n j (x j − x )2
k SS A MS A
MS A = F=
Entre grupos j =1 k-1 k −1 MS E
N −k
SSE= ∑ ∑ (xij − x j )2
Dentro dos grupos k nj SS E
MS E =
ou residual
j =1i =1 N −k
N −1
SST= ∑ ∑ (xij − x )
Total k nj
2

j =1i =1

Pode-se provar que SST = SSA+SSE, o que permite verificar os cálculos da Tabela ANOVA.
Exemplo 1
Carla Henriques Departamento de Matemática — ESTV
18
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Vamos ver o que podemos concluir ao nível de significância de 0.05.

Cálculo do SSE= ∑ ∑ (xij − x j )2


k nj

j =1i =1

5
∑ ( xi1 − x1 ) = (47 − 49 ) + (53 − 49 ) + (49 − 49 ) + (50 − 49 ) + (46 − 49 ) = 30
2 2 2 2 2 2

i =1
5
∑ ( xi 2 − x2 ) = (55 − 56 ) + (54 − 56 ) + (58 − 56 ) + (61 − 56 ) + (52 − 56 ) = 50
2 2 2 2 2 2

i =1
5
(
∑ i3 3
x − x )2
= (54 − 51)2
+ (50 − 51)2
+ (51 − 51)2
+ (51 − 51)2
+ ( 49 − 51)2
= 14 .
i =1

SSE=30+50+14=94

Cálculo do SSA= ∑ n j (x j − x )2
k

j =1

Carla Henriques Departamento de Matemática — ESTV


19
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

SSA= 5 (49 − 52 ) + 5 (56 − 52 ) + 5 (51 − 52 ) = 130


2 2 2

Apresentamos a seguir a Tabela ANOVA relativa ao Exemplo 1.

Fonte de Variação Soma de Quadrados Graus de Variância (Soma Média Razão F


Liberdade de Quadrados)
Entre grupos SSA=130 2 MSA=130/2=65 65/7.83
=8.3
Dentro dos grupos SSE=94 12 MSE=94/12=7.83
ou residual
Total SST=224 14

Se a hipótese H0 é verdadeira,
MS A
F= ~ F122 .
MS E
Carla Henriques Departamento de Matemática — ESTV
20
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

F1−α ,2,12 = 3.89 (quantil de probabilidade 1-α da distribuição F122 )

R.C.=[3.89,+∞[
65
O valor observado da estatística F é: Fobs = = 8.3 ∈R.C.
7.83

Então a hipótese H0 é rejeitada ao nível de significância de 0.05, isto é, existem diferenças


significativas entre as médias amostrais das vendas.

Há portanto evidência de que existem pelo menos duas lojas com volumes médios de
vendas diferentes. Por outras palavras, o factor Loja exerce uma influência significativa sobre
o volume de vendas.

Exemplo 2
Suponha que é director de marketing de uma empresa que pretende relançar um produto no
mercado. Você estudou três campanhas de marketing diferentes, cada uma deles combina de
Carla Henriques Departamento de Matemática — ESTV
21
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

modo diferente factores como o preço do produto, a apresentação do produto, promoções


associadas, etc. Qualquer uma destas campanhas é levada a cabo no ponto de venda, não
havendo qualquer publicidade nos meios de comunicação. Para saber se há diferença entre as
três campanhas relativamente à sua eficácia, cada uma delas é feita num conjunto de lojas
seleccionadas aleatoriamente, durante um período de duração limitada. Note que as lojas são
seleccionadas de modo a que as três amostras sejam aleatórias e independentes entre si. As
vendas (em unidades monetárias – u. m.) registadas durante este período constam da tabela
seguinte.

Carla Henriques Departamento de Matemática — ESTV


22
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Campanha 1 Campanha 2 Campanha 3


8 10 7
6 8 5
5 12 8
6 7 6
7 9 7
10 5
11
Soma 32 67 38

Seja Xi a v.a. que representa o volume de vendas de uma loja sujeita à campanha i (i=1,2,3).
Admitamos que X1, X2 e X3 têm distribuição normal com iguais variâncias.

Carla Henriques Departamento de Matemática — ESTV


23
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

As hipóteses em teste são:


H0: µ1= µ 2 = µ3
(não há diferença entre as campanhas de marketing relativamente ao volume médio de
vendas a que conduzem)
H1: µi ≠ µ j para algum i e algum j tais que i≠j
(pelo menos duas campanhas de marketing conduziram a volumes médios de vendas
diferentes)

Fixemos o nível de significância em 0.01.


Sob o pressuposto de H0 ser verdadeira,
MS A
F= ~ F152 .
MS E
F1−α ,2,15 = 6.36 (quantil de probabilidade 1-α=0.99 da distribuição F152 )

R.C.=[6.36,+∞[
Para as amostras recolhidas, tem-se:
Carla Henriques Departamento de Matemática — ESTV
24
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

• x1 = 6.4 , x3 = 6.3333
x2 = 9.5714 , e x = 7.611;
44.03
• SSA= 44.03 e MSA= = 22.015 ;
2
30.2476
• SSE= 30.2476 e MSE= = 2.0165 .
15

22.015
O valor observado da estatística F é: Fobs = = 10.9174 ∈R.C.
2.0165

Ao nível de significância de 0.01, rejeita-se a hipótese H0 de igualdade de médias, pois o valor


observado da estatística de teste pertence à região crítica. Há, portanto, evidência estatística
de que as três campanhas não são iguais relativamente ao volume médio de vendas a que
conduzem. Isto é, o tipo de campanha influencia significativamente o volume de vendas.

Carla Henriques Departamento de Matemática — ESTV


25
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

A Tabela ANOVA para este exemplo é a seguinte.

Fonte de Variação Soma de Quadrados Graus de Variância (Soma Razão F


Liberdade Média de Quadrados)
Entre grupos SSA=44.03 2 MSA= 22.015 10.9174
Dentro dos SSE=30.247 15 MSE= 2.0165
grupos ou
residual
Total SST=74.277 19

Carla Henriques Departamento de Matemática — ESTV


26
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

TESTES DE COMPARAÇÃO MÚLTIPLA


Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos
evidência de que existem diferenças entre as médias populacionais.
Mas, entre que médias se registam essas diferenças?

Os testes de comparação múltipla permitem responder à questão anterior, isto é, permitem


investigar onde se encontram as diferenças possíveis entre k médias populacionais.

Existem muitos testes deste tipo, no entanto, aqui vamos abordar apenas dois:
¾ teste HSD (honestly significant difference) de Tuckey
¾ teste de Scheffé

Estes testes permitem examinar simultaneamente pares de médias amostrais para


identificar quais os pares onde se registam diferenças significativas.

Carla Henriques Departamento de Matemática — ESTV


27
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Pressupostos destes testes:


1. As amostras devem ser aleatórias e independentes;
2. As amostras devem ser extraídas de populações normais;
3. As populações devem ter variâncias iguais (σ 12 = L = σ k2 = σ 2 ) – homocedasticidade.

TESTE HSD DE TUCKEY


Quando as amostras têm tamanhos iguais este teste é mais adequado do que o teste de
Scheffé.
O teste HSD de Tuckey foi originalmente desenvolvido para amostras de igual tamanho, no
entanto, muitos estatísticos sustentam que este é um método robusto a desvios moderados
deste pressuposto.
Também se considera um dos testes mais robustos a desvios da normalidade e
homocedasticidade.

Carla Henriques Departamento de Matemática — ESTV


28
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Neste teste, duas médias amostrais são comparadas usando

MS E ⎛⎜ 1 1 ⎞⎟
ST (1−α ) . +
2 ⎝ ni n j ⎟⎠

onde, ST (1−α ) é o quantil de probabilidade (1-α) da distribuição da “Studentized Range” com

(k , N − k ) graus de liberdade – ST (k , N - k) :

P (W ≤ ST (1−α ) ) = 1 − α , W ~ ST (k , N - k) .

A hipótese H0: µi = µj é rejeitada, isto é, as médias amostrais xi e x j são consideradas

significativamente diferentes, se

MS E ⎛1 1 ⎞
xi − x j ≥ S T (1−α ) . ⎜ + ⎟.
2 ⎜n n ⎟
⎝ i j ⎠

Carla Henriques Departamento de Matemática — ESTV


29
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Também se pode calcular um intervalo de confiança:

MS E ⎛⎜ 1 1 ⎞⎟
[IC](1-α ) = (xi − x j ) ± ST ( 1− α ) . +
2 ⎜⎝ ni n j ⎟⎠

Exemplo 1
™ x1 − x2 = 49 − 56 = 7 ,

™ x1 − x3 = 49 − 51 = 2

™ x2 − x3 = 56 − 51 = 5

Usando um nível de significância igual a 0.05, vem:


ST (1−α ) =3.77

Carla Henriques Departamento de Matemática — ESTV


30
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

MS E ⎛⎜ 1 1 ⎞⎟ 7.83 2
ST (1−α ) . + = 3. 77 × =4.718

2 ⎝ ni n j ⎠⎟ 2 5

Como x1 − x2 = 7 > 4.718, rejeita-se a hipótese H0:µ1= µ2.

Também, x2 − x3 = 5 > 4.718, logo rejeita-se a hipótese H0:µ2= µ3.

Finalmente, como x1 − x3 = 2 < 4.718, não se rejeita a hipótese H0:µ1= µ3.

Assim, há evidência de que a loja 2 tem um volume médio de vendas diferente das lojas 1 e 3.
Isto é, a média observada para a loja 2 difere significativamente das médias observadas para
as lojas 1 e 3, enquanto que, a diferença registada entre o volume de vendas da loja 1 e da loja
3 não é significativa.

Carla Henriques Departamento de Matemática — ESTV


31
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

TESTE SCHEFFÉ
Neste teste a hipótese nula H0: µi = µj é rejeitada se
⎛1 1⎞
xi − x j ≥ (k - 1)F(1- α ) . MS E ⎜⎜ + ⎟⎟
⎝ ni n j ⎠
onde, F(1−α ) é o quantil de probabilidade (1-α) da distribuição FNk −−1k :

( )
P FNk −−1k ≤ F(1−α ) = 1 − α .

Intervalo de confiança:

⎛1 1⎞
[IC](1-α ) = (xi − x j ) ± (k - 1)F(1- α ) . MS E ⎜⎜ + ⎟⎟
⎝ ni n j ⎠

Carla Henriques Departamento de Matemática — ESTV


32
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Exemplo 2
™ x1 − x2 = 6.4 − 9.5714 = 3.1714

™ x1 − x3 = 6.4 − 6.3333 = 0.0667

™ x 2 − x3 = 9.5714 − 6.3333 = 3.2318

Consideremos um nível de significância igual a 0.01.

⎛1 1⎞
• x1 − x2 = 3.1714> ( k − 1) F(1−α ) . MS E ⎜ + ⎟
⎜n n ⎟
⎝ i j⎠

⎛1 1⎞
= 2 × 6.36 . 2.0165⎜ + ⎟ =2.97, → rejeita-se a hipótese H0: µ1= µ2;
⎝5 7⎠

⎛1 1⎞
• x1 − x 3 = 0.0667< 2 × 6.36 . 2.0165⎜ + ⎟ =3.0667 → não se rejeita H0: µ1= µ3;
⎝5 6⎠
Carla Henriques Departamento de Matemática — ESTV
33
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

⎛1 1⎞
• x 2 − x 3 = 3.2318 > 2 × 6.36 . 2.0165⎜ + ⎟ =2.8177, → rejeita-se H0: µ2= µ3.
⎝6 7⎠

Assim, ao nível de significância de 0.01, há evidência de que à campanha de marketing 2 está


associado um volume médio de vendas diferente dos volumes médios associados às
campanhas 1 e 3. Isto é, a média observada para a campanha 2 difere significativamente das
médias observadas para as campanhas 1 e 3, enquanto que, a diferença registada entre as
campanhas 1 e 3 não é significativa.

Carla Henriques Departamento de Matemática — ESTV


34
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

TESTES PARA A COMPARAÇÃO ENTRE K VARIÂNCIAS

Hipóteses a testar: H0: σ 12 = σ 22 = L = σ k2


H1: σ i2 ≠ σ 2j para algum i e algum j tais que com i ≠ j

Teste de Bartlett
Este teste tem como pressuposto que as populações tenham distribuição normal.
Além disso, só é aplicável quando as diferentes amostras envolvidas tenham dimensões nj não
inferiores a quatro ( n j ≥ 4 , para todo o j).

Carla Henriques Departamento de Matemática — ESTV


35
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

1⎡ ⎤
( ) ∑ (n j − 1) ln( ) ~ χ k2−1
k sobH 0
Estatística de teste: B = ⎢( N − k ) ln S 2p − S 2j ⎥
C ⎢⎣ j =1 ⎦⎥
onde,
k
¾ N= ∑ n j
j =1
1 n j

¾ S 2j = ∑ ( X ij − X j )
2
n j − 1 i =1
k

1
¾ S 2p = (n j − 1) S 2j
N −k j =1

1 ⎡k 1 1 ⎤
¾ C = 1+ ⎢∑ − ⎥
3(k − 1) ⎢⎣ j =1n j − 1 N − k ⎥⎦

Trata-se de um teste unilateral à direita: rejeita-se H0 se Bobs≥ χ12−α , k −1 , onde χ12−α , k −1 é o


quantil de probabilidade (1-α) da distribuição χ k2−1.

Carla Henriques Departamento de Matemática — ESTV


36
Dep. Matemática
Escola Superior de ANÁLISE DE VARIÂNCIA
Tecnologia de Viseu

Exemplo 1
Vamos testar a hipótese H0, de igualdade de variâncias das três variáveis consideradas, ao
nível de significância de 0.01.
Sob o pressuposto de H0 ser verdadeira,
1⎡
( ) ( )⎤
B = ⎢( N − k ) ln S p − ∑ (n j − 1) ln S 2j ⎥ ~ χ 22 .
k
2
C⎣ j =1 ⎦
χ 02.99, 2 = 9.21 (quantil de probabilidade 0.99 da distribuição χ 22 )

R.C.= [9.21, +∞[.


Para as amostras recolhidas tem-se,
1
Bobs = [15 ln(2.0165) − 4 ln(1.3) − 6 ln(2.95) − 5 ln(1.4667)]=0.971 ∉ R. C.
1.09167
Ao nível de significância de 0.01, não se pode rejeitar a hipótese de que as três variáveis
populacionais tenham iguais variâncias.

Carla Henriques Departamento de Matemática — ESTV


37

Você também pode gostar