Você está na página 1de 39

VI.

Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

107
VI. TESTE DE HIPTESES



6.1 A estatstica como ferramenta auxiliar na tomada de decises

A maioria das situaes de tomada de decises ocorrem em situao de incerteza, porque
baseada nos dados de uma amostra proveniente de uma populao. Nesses casos, a
estatstica fornece um poderoso instrumento para a tomada de decises. Tentaremos,
atravs de um exemplo, explorar a lgica desse tipo de tomada de deciso estatstica.

Suponha que voc tem R$20.000,00 (vinte mil reais) na poupana e est pensando investir
esse capital na construo e funcionamento de um posto de gasolina, em um ponto
movimentado de So Paulo. Suponha, tambm, que para o posto ser rentvel (pagar o
investimento inicial e dar um lucro maior do que a poupana), o nmero mdio () de
veculos que passam por aquele ponto por dia (parmetro) deve ser maior a 2000
(hiptese estatstica, chamada de hiptese nula H
o
).

Este um problema clssico de teste de hipteses, pois voc decidir aceitar ou rejeitar a
hiptese nula, em funo dos resultados de uma amostra. Isto porque seria impossvel
examinar o nmero de veculos que passam todos os dias por aquele ponto (populao),
alm da disponibilidade de recursos financeiros, entre outros. Ao pegarmos uma amostra
de uma populao estamos lidando com leis de probabilidades, logo voc no tem
condio de saber se sua hiptese nula verdadeira ou falsa, voc apenas pode medir as
probabilidades envolvidas na sua tomada de deciso.

No nosso exemplo, aceitar a hiptese nula, de que o nmero de veculos que passam pelo
ponto maior de 2000, implicar em voc tirar o dinheiro da poupana e investir no posto
de gasolina; mas, a hiptese nula pode ser falsa, e a, todo o empreendimento estar fadado
ao fracasso, voc perder seu capital. O custo de uma deciso errada pode ser muito
grande, em termos financeiros, de vidas humanas, etc. Vejamos como o quadro decisrio:

Aceitar a hiptese nula (H
o
) quando ela verdadeira uma deciso correta. No nosso
exemplo significa construir o posto e realmente passam 2000 ou mais veculos por dia,
logo o investimento ser rentvel, voc recuperar seu capital e ter um retorno financeiro
acima do rendimento da caderneta de poupana. Rejeitar uma hiptese falsa, tambm,
uma deciso correta, no caso, significa no construir o posto, deixar o dinheiro na
poupana, uma vez que o posto no tinha chances de ser rentvel.

Entretanto, existem dois tipos de erro ao tomarmos esse tipo de deciso. O primeiro erro
rejeitar a hiptese nula (H
o
) quando ela verdadeira, chamado de erro de tipo I; no
nosso exemplo, significa deixar de construir o posto quando ele seria rentvel, neste caso, a
perda no inclui valores fsicos financeiros, apenas o valor fictcio que se deixou de
ganhar. O segundo erro aceitar a hiptese nula (H
o
) quando ela falsa, chamado de
erro de tipo II, no exemplo significa construir o posto, quando por aquele ponto passam
menos do que 2000 veculos, o que implicaria a perda do capital.


VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

108
Tabela 8. Quadro de deciso em condio de incerteza
(Postura inovadora)

Hiptese nula H
o

passam mais de 2000 veculos por dia: H
o
: > 2000
Deciso Hiptese (H
o
) ser verdadeira:
H
o
: > 2000
(o posto ser rentvel)
Hiptese (H
o
) ser falsa
H
o
: < 2000
(o posto est fadado ao fracasso)
Aceitar a hiptese
(construir o posto)
Constri o posto e rentvel

Deciso correta
(1-o)
Constri o posto e ele no
rentvel. Perde o capital
Erro de tipo II
Beta (|)
Rejeitar a hiptese
(deixar o dinheiro
na poupana)
No constri o posto, porm seria
rentvel (deixa de lucrar)
Erro de tipo I
Alfa (o)
No constri o posto e no era
rentvel
Deciso correta
(1-|)


A teoria estatstica nos possibilita medir todas as probabilidades envolvidas na questo,
logo podemos nos prevenir, controlando a probabilidade de cometer o erro mais grave. A
probabilidade de cometer o erro de tipo I (rejeitar a hiptese nula H
o
quando ela
verdadeira) simbolizada por alfa (o), tambm, conhecida como nvel de significncia.

o = nvel de significncia erro de tipo I

o = P (Rejeitar H
o
/ H
o
verdadeira)

J a probabilidade de cometer o erro de tipo II (aceitar a hiptese nula H
o
quando ela
falsa) simbolizada por beta (|), que est relacionado com o poder do teste.

| = P (Aceitar H
o
/ H
o
falsa) erro de tipo II


Essas probabilidades, alfa e beta, se relacionam inversamente, quando diminumos alfa,
beta cresce e vice-versa, e no d para controlar as duas simultaneamente, a menos que se
aumente o tamanho da amostra, o que implica no aumento de custos operacionais e de
tempo, o que pode inviabilizar a pesquisa (ver Figura 32).

Todos os testes estatsticos foram delineados para controlar alfa (o) o nvel de
significncia, sendo que beta (|) deixado livre. Por essa razo, a formulao da
hiptese nula deve ser feita de tal forma que o erro mais grave recaia em alfa. No nosso
exemplo analisando os dois tipos de erros, verificamos que o erro mais grave recai em
beta. A pergunta : como devemos formular a hiptese nula H
o,
de tal forma que o pior
erro caia em alfa? Neste caso, s trocar a hiptese, negando a afirmao inicial. Vejamos
o que acontece no quadro decisrio:


VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

109
Tabela 9. Mudana no quadro decissrio ao mudar a hiptese
(Postura conservadora)

Hiptese nula H
o

passam 2000 ou menos veculos por dia: H
o
: < 2000
Deciso Hiptese (H
o
) ser verdadeira:
H
o
: < 2000
(o posto est fadado ao fracasso)
Hiptese (H
o
) ser falsa
H
o
: > 2000
(o posto ser rentvel)
Aceitar a hiptese
(deixar o dinheiro
na poupana)

No constri o posto e no era
rentvel
Deciso correta
(1-o)
Deixa de construir o posto quando
seria rentvel (deixa de lucrar)
Erro de tipo II
Beta (|)
Rejeitar a hiptese
(construir o posto)

Constri o posto e ele no
rentvel (perde o capital)
Erro de tipo I
Alfa (o)
Constri o posto e rentvel

Deciso correta
( 1- |)


Verificamos que ao negarmos a hiptese que desejamos testar asseguramos que o pior erro
recaia em alfa, que controlado pelo pesquisador. Este tipo de formulao conhecida
como postura conservadora. Ou seja, estamos mais propensos a deixar o dinheiro na
poupana (ou deixar do jeito que est) do que investir no risco (mudar para o novo) e,
arriscaremos, somente, quando houver evidncias da amostra muito fortes a favor do novo.

Portanto, devemos ser cuidadosos na formulao de hipteses para saber qual o tipo de
erro que estamos controlando. O nvel de significncia fixada pelo pesquisador.
convencional trabalhar com alfa igual a 1%, 5% ou 10%, sendo que em alguns casos
podemos usar nveis maiores. A escolha do nvel de significncia (o) estar de acordo
com a margem de segurana e da gravidade das conseqncias de vir a ocorrer o erro de
tipo I.


A formulao de hipteses:

Em todo processo de deciso estatstica, alm da hiptese nula H
o
existe a hiptese
alternativa H
1
. Todo o processo decisrio ser feito em funo de H
o
, ou seja, aceitar ou
rejeitar H
o
. Logo, aceitaremos H
1
s se a hiptese nula for rejeitada. conveno se
colocar na Hiptese nula H
o
o sinal de igualdade, embora, via de regra, a negao da
hiptese alternativa. Observamos que a maioria dos testes j tem as hipteses formuladas.

A hiptese nula H
o
coloca-se com o expresso propsito de ser rejeitada, se for rejeitada,
pode-se aceitar a hiptese alternativa (na postura conservadora a negao do que se quer
provar). A hiptese alternativa H
1
a definio operacional da hiptese de pesquisa, que
a predio deduzida da teoria que est sendo testada (na postura conservadora a
afirmao do novo, do que se quer mostrar).



VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

110
Tabela 10. Os erros em funo da formulao das hipteses

Postura conservadora Postura inovadora
Hiptese nula
Hiptese alternativa
H
o
: = 2000
H
1
: > 2000
H
o
: = 2000
H
1
: < 2000
Erro de tipo I
Alfa (o)
Construir o posto e o nmero
mdio inferior a 2000, logo
perderemos o capital
No construir o posto e o nmero
mdio maior do que 2000,
deixamos de lucrar
Erro de tipo II
Beta (|)
No construir o posto e o nmero
mdio maior do que 2000,
deixamos de lucrar
Construir o posto o nmero
mdio inferior a 2000, logo
perderemos o capital



A construo da regio crtica ou de rejeio:

Uma vez decidida as hipteses nula e alternativa e o nvel de significncia, decide-se a
estatstica a ser utilizada para operacionalizar a hiptese. Essa estatstica depende do
parmetro que est sendo testado. No caso da mdia populacional a estatstica ser a
mdia amostral, que segue uma distribuio normal, pelo Teorema Central do Limite.
Com essas informaes se constri a regio crtica.

A regio crtica ou de rejeio depende da hiptese alternativa e seu tamanho o mesmo
do nvel de significncia, o complemento chamado de regio de aceitao. A localizao
da regio crtica depende da hiptese alternativa (ver Figura 32).


O processo decisrio

A deciso de rejeitar ou aceitar a hiptese nula depende dos resultados da amostra.
Calculada a estatstica apropriada s verificar em qual das duas regies ela cai. Se cair na
regio de aceitao, aceitaremos a hiptese nula, caso contrrio, a rejeitaremos. Se a
hiptese nula for rejeitada ento aceitaremos a hiptese alternativa. Observamos que todo
processo decisrio feito com a hiptese nula, a deciso em relao hiptese alternativa
mera conseqncia:

maior
o
Aceita Ho
p-valor
10

menor
o
Rejeita Ho Aceita H
1



10
ver operacionalizao, pgina 113
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

111
Figura 32. Regio de rejeio e de aceitao da hiptese nula e relao entre alfa e beta,
no caso da postura conservadora


















= 2500 X


Regio de rejeio e de aceitao da hiptese nula

Unilateral Bilateral Unilateral
Cauda inferior Bicaudal Cauda superior
H
1
: < 2000 H
1
: = 2000 H
1
: > 2000



Operacionalizando a tomada de deciso

A construo da estatstica da amostra depende do parmetro que est sendo testado, se for
a mdia populacional, a estatstica estar baseada na distribuio da mdia amostral, se for
a proporo populacional, a estatstica usar a proporo amostral e assim por diante.


RR: Regio
Crtica ou de
Rejeio

RA: Regio
de Aceitao

1-|
RR
X
= 2000
X N n ~ ( . , ) 2 000
2
o
Distribuio da
mdia amostral,
sob Ho verdadeira

RA=(1-o) RR=o
Distribuio da
mdia amostral,
sob Ho falsa

X N n ~ ( . , ) 2500
2
o
|
RA
RA RA

RA

RR
o
RR
o/2
RR
o
RR
o/2
1o 1o 1o
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

112
6.2 Teste de hiptese para a mdia populacional

Suponhamos que voc selecionou uma amostra de 30 dias, em meses diferentes (tendo
cuidado de representar os dias da semana, bem como os finais de semana) e, que a mdia
amostral seja 2050 veculos, com um desvio padro de 200.

Como n=30 podemos fazer uso do Teorema Central do Limite (ver quadro, pgina 101),
estimando o desvio padro populacional com o desvio padro da amostra, sob a hiptese
nula:










- 0 +
Z
amostra
=1,37 Z
o
= 1,645

Como Z
amostra
menor que Z
o
, ento aceita-se Ho, ou seja, devemos deixar o dinheiro na
poupana.



Em geral, a regra de deciso ser: Rejeita-se a hiptese nula H
o
se:

Cauda inferior Bicaudal Cauda superior
H
1
: <
o
H
1
: =
o
H
1
: >
o


VC VC
1
VC
2
VC

VA < VC VA < VC
1
ou VA > VC
2
VA > VC
11


11
Onde VA o valor da amostra e VC o valor crtico
Z
X
s n
o
=

X N S n
o
~ ( , )
2
Z
amostra
=

=
2050 2000
200
30
13693 ,
X N ~ ( . ; ) 2 000
200
30
2
ou
ou

Unilateral
Cauda superior
H
o
: = 2000
H
1
: > 2000

RA: 1-o=95%
RR: o =5%
Em geral:
No nosso
exemplo:
RA RA RA

RR RR
RR RR
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

113
Este procedimento trabalhoso, pois voc tem que ter a tabela da distribuio da estatstica
(normal, t-student, etc.), o que s se justifica se voc no tiver a mo um pacote estatstico.

Para evitar o fato de ter que procurar os valores em tabelas, a maioria dos pacotes
estatsticos fornece, alm do valor da estatstica da amostra, o p-valor (p-value ou
significance), conhecido, tambm, como nvel de significncia observado ou da amostra.
Este valor deve ser comparado com o nvel de significncia (o) escolhido pelo
pesquisador, neste caso s comparar os dois valores. Se o p-valor for menor que alfa,
rejeita-se a hiptese nula; caso contrrio, aceita-se ( ver pgina 110).

Como calcular o p-valor:

O p-valor a probabilidade que a estatstica supere o valor observado na amostra, maior se
for da cauda superior, menor se for da cauda inferior, ou a probabilidade de rejeitar a
hiptese nula quando ela verdadeira, com os valores daquela amostra.

Se for cauda superior
H
o
: = 2000
H
1
: > 2000
p-valor = P( Z > Z
amostra
)

Se for cauda inferior
H
o
: = 2000
H
1
: < 2000
p-valor = P( Z < Z
amostra
)

Se for bicaudal
H
o
: = 2000

H
1
: = 2000
p-valor = P( Z > Z
amostra
) se Z
amostra
for +
ou
p-valor = P( Z < Z
amostra
) se Z
amostra
for

Este valor deve ser multiplicado por 2

No nosso exemplo:
p-valor = P ( Z > Z
amostra
)
p-valor = P ( Z > 1,37) = 0,08534 ou 8,5%

Como essa probabilidade maior que o=0,05 cai na regio de aceitao. Logo aceita-se
H
o.


Resumindo: passos para construo de um teste de hiptese:

Passo N
o
1: Formular as hipteses nula e alternativa
Passo N
o
2: Usando a teoria estatstica e as informaes disponveis decida qual estatstica
(estimador) ser usada para julgar a hiptese Ho. No esquea dos
pressupostos implcitos na construo desta estatstica
Passo N
o
3: Fixar o nvel de significncia e construir a Regio Crtica
Passo N 4: Calcular a estatstica da amostra
Passo N
o
5: Tomar a deciso

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

114
6.2.1 Teste de hipteses para a mdia populacional: pequenas amostras

O exemplo dos tomates

Suponha que voc fiscal sanitarista da CEASA e que est inspecionando um
carregamento de tomates. Segundo as normas, a quantidade tolerada pelo corpo humano de
uma substncia txica e de at no mximo 10 unidades. Para decidir se voc deve liberar
ou no o carregamento, seleciona uma amostra de tomates e com base nos dados, tomar a
deciso. Analisemos o processo de formulao das hipteses, o nvel de significncia e a
tomada deciso.


Conceitos Notao Definio
Populao Est formado por todos os tomates do carregamento
Amostra Os tomates que carem na amostra
Varivel X Quantidade de txico por tomate
Parmetro mdia
populacional
Quantidade mdia da substncia txica por tomate naquele carregamento
Estimador mdia amostral
X barra
Quantidade mdia da substncia txica por tomate da amostra
Estimativa Valor da mdia daquela amostra


Tabela 11. Quadro de deciso em condio de incerteza
(Postura tica)




Deciso
Hiptese nula H
o
: > 10
A quantidade mdia de substncia txica superior a 10 unidades
H
o
: > 10 ser verdadeira
(os tomates esto contaminados)
H
o
: > 10 ser falso
(os tomates esto aptos para o
consumo)
Aceitar a hiptese
(incinerar o
carregamento)
Incinera o carregamento e os tomates
estavam contaminados
Deciso correta
( 1 - o )
Incinera, porm os tomates estavam
aptos para o consumo
O produtor perdeu sua colheita
Erro de tipo II
Beta ( | )
Rejeitar a hiptese
(liberar para o
consumo humano)
Libera o carregamento e os tomates
estavam contaminados
As pessoas sero contaminadas
Erro de tipo I
( o )
Libera e os tomates estavam aptos
para o consumo
Deciso correta
( 1 - | )

No caso da postura tica, o nvel de significncia alfa (o) significa o risco de liberar o
carregamento quando ele est contaminado e, consequentemente, colocar em risco vida
humanas, porm, voc controla esse tipo de erro.

Certamente, o produtor no vai aceitar este tipo de formulao da hiptese, pois para ele o
carregamento de tomates no est contaminado. Vejamos com seria a formulao das
hipteses neste caso.
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

115
Tabela 12. Quadro comparativo da formulao de hipteses do
ponto de vista do consumidor e do produtor

Postura tica
(Postura do consumidor)
Postura produtor
Hiptese nula
Hiptese alternativa
H
o
: = 10 (*)
H
1
: < 10
H
o
: = 10
H
1
: > 10
Erro de tipo I
Alfa (o)
Liberar o carregamento de
tomates quando eles estavam
contaminados
Incinerar o carregamento de tomates
quando eles estavam aptos para o
consumo humano
Erro de tipo II
Beta (|)
Incinerar o carregamento de
tomates quando eles estavam
aptos para o consumo humano
Liberar o carregamento de tomates
quando eles estavam contaminados
(*) Lembrar que conveno colocar o sinal da igualdade na hiptese nula.

A final, voc deve estar se perguntando, como isso influncia na tomada de decises, se a
estatstica calculada da amostra sempre nica. Vejamos atravs do exemplo, calculando
as regies crticas para as duas formulaes.

Suponha que esta varivel siga uma distribuio normal e que voc seleciona uma amostra
de 16 tomates, cuja mdia 9 unidades, com um desvio padro de 2.

Operacionalizando a postura tica:

Passo 1: Formular as hipteses:
H
o
: = 10
H
1
: < 10

Passo 2: A estatstica a ser utilizada ser a mdia amostral, estimando a varincia
populacional pela amostral, ou seja, devemos utilizar a distribuio t-student, com
15 graus de liberdade, lembre-se que esta distribuio pressupe normalidade para
a distribuio da varivel.

Passo 3: Para o=5%, determinar a regio de rejeio e aceitao. O valor t
o
= 1,753
A regio crtica estar formada por todos os valores menores ou iguais a 1,753

Passo 4: Calcular a estatstica (observe que isto independe das hipteses)
n=16, mdia amostral = 9, desvio padro da amostra =2

Passo 5: Tomar a deciso
Como o valor da amostra foi 2 (t
amostra
= 2,0) menor que o valor crtico
(t
o
= 1,753), rejeita-se H
o

Ou seja, liberamos o carregamento de tomates.
t
X
s
n
amostra
o
=

t
amostra
=

=
9 10
2
16
2
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

116
Contudo, voc est com muito receio de liberar o carregamento e este estar contaminado.
Voc pode diminuir o de 5% para 1%. Vejamos o que acontece:

- 0 +
t
1
=2,602 t
5
=1,753

t
amostra
=2,0

A nica mudana ser no Valor Crtico, que de t
o
= 1,753 cara para t
o
= 2,602. Neste
caso, aceitaremos H
o
, ou seja, mandaremos incinerar o carregamento de tomates.

Operacionalizando a postura do produtor:

Passo 1: Formular as hipteses:
H
o
: = 10
H
1
: > 10

Passo 2: a mesma da postura tica, pois independe da formulao das hipteses:

Passo 3: Para o=5%, determinar a regio de rejeio e aceitao. O valor t
o
= + 1,753
A regio crtica estar formada por todos os valores maiores ou iguais a +1,753
(o nico que muda a cauda, que passa de ser inferior, para superior)

Passo 4: Calcular a estatstica (idem postura tica, observe que isto independe das
hipteses)
t
amostra
= 2,0

Passo 5: Tomar a deciso
Como o valor da amostra foi 2 (t
amostra
= 2) menor que o valor crtico
(t
o
= + 1,753), aceita-se H
o


logo libera o carregamento para o consumo humano, deciso que coincide com a deciso
da postura tica. Porm, vejamos o que acontece se diminuirmos o de 5% para 1%. Neste
caso, t
1
=+2,602, e, consequentemente, a deciso no muda, ou seja, continuamos
liberando o carregamento, ao contrrio da postura tica, e isso porque neste caso, o est
protegendo o produtor, ou seja, do risco de incinerar o carregamento, quando os tomates
esto sadios.
o=1% o=5%
t
15

RA: Incinerar o
carregamento
RR: Liberar o
carregamento
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

117
Figura 33. Regio Crtica na postura do produtor
- 0 +
t
amostra
=2,0 t
5
=+1,753 t
1
=+2,602

Mas voc deve estar intrigado como essas duas posturas agem na regra deciso.
Tentaremos apresentar aqui a lgica das duas posturas.

Sabemos que sob a hiptese nula, a mdia amostral se distribui segundo uma t-student com
n-1 graus de liberdade (no esquea que est implcito que X: quantidade de txico por
tomate segue uma distribuio normal, alm das amostras independentes)


Logo podemos perguntar a partir de que valores da mdia amostral rejeitaremos H
o
, fixado
o nvel de significncia.

Logo no nosso exemplo, substituindo os valores:
o
=10, o=2 e n=16

X
c
< 10 1,753*2/4 X
c
< 10-0,8765 X
c
< 9,1235

Logo todas as amostras cujas mdias forem menores ou iguais a 9,1235 tero suas cargas
liberadas.


Logo, substituindo os valores:

X
c
> 10 +1,753*2/4 X
c
> 10+0,8765 X
c
> 10,8765

Logo todas as amostras cujas mdias forem maiores ou iguais a 10,8765 tero suas cargas
incineradas.
o=5% o=1%
t
15

RA: Liberar o
carregamento
RR: Incinerar o
carregamento
P X X
c
( ) < = o
X
s
n
t
n

~
1
X t
s
n
c
o
<
o
Na postura tica:
P X X
c
( ) > = o
X t
s
n
c
o
> +
o
Na postura do produtor:
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

118
Comparemos graficamente as regras de deciso em cada caso. Para simplificar a
comparao suponhamos que a varincia conhecida igual a 4:

X: quantidade de txico por tomate X ~N(10,2
2
) (supondo o=2, conhecido)



4 6 8 10 12 14 16
3o 2o o +o +2o +3o


X~ N(10, ) uma vez que a varincia amostral o
2
/n =2
2
/16 =1/2 erro padro=0,71


7,9 8,6 9,3 10 10,7 11,4 12,1



Na postura tica Rejeita-se H
o
Liberar para o consumo se:
H
o:
= 10 se a mdia amostral for menor que
H
1
: <
o
Zo-o/Vn = 10 1,645*0,71
= 10 1,16795 8,83205

Rejeita-se H
o
Aceita-se H
o

Libera o carregamento Incinera o carregamento


7,9 8,6 9,3 10 10,7 11,4 12,1


Na postura do produtor Rejeita-se H
o
Incinerar o carregamento se:
H
o
: = 10 se a mdia amostral for maior que
H
1
: >
o
+Zo-o/Vn = 10 + 1,645*0,71
= 10 + 1,16795 11,16795


Aceita-se H
o
Rejeita-se H
o

Libera o carregamento Incinera o carregamento


7,9 8,6 9,3 10 10,7 11,4 12,1

Veja que na postura tica mandaremos incinerar o carregamento se a mdia da amostra
for maior ou igual a 8,83205, enquanto que na postura do produtor, s faremos isso quando
a mdia da amostra for maior ou igual a 11,16795. Neste exemplo supomos conhecer a
varincia s com fins didticos. A lgica a mesma, quando tivermos que estimar a
varincia, apenas mudaremos de distribuio.

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

119
6.3 Teste de hipteses para a proporo populacional: t

O exemplo da eleio de um candidato

Suponha que voc assessor de um grupo financeiro forte, que est interessado em saber
se o candidato XYZ, ao governo do estado de So Paulo, tem chances de ser eleito, ainda
no primeiro turno, uma vez que o grupo est estudando a possibilidade de financiar sua
campanha. Neste caso, novamente, voc selecionar uma amostra e decidir com base nos
dados dessa amostra. Vejamos o quadro decisrio neste caso:

Conceitos Notao Definio
Populao Os eleitores do estado de So Paulo
Amostra Os eleitores que forem sorteados para compor a amostra
Parmetro
Proporo populacional t
Porcentagem ou proporo de eleitores do estado que
votaro no candidato XYZ
Estimador Proporo amostral
P barra
Porcentagem ou proporo de eleitores da amostra que
votaro no candidato XYZ
Estimativa Valor da proporo daquela amostra


Tabela 13. Quadro de deciso em condio de incerteza
(Postura otimista)


Hiptese nula H
o
: t > 0,50
O candidato XYZ se elege no primeiro turno
Deciso H
o
: t > 0,50 ser verdadeira
(o candidato se elege)
H
o
: t > 0,50 ser falsa
(o candidato no se elege)
Aceitar a hiptese
(investir na campanha
do candidato)
Investe na campanha do candidato
XYZ e este se elege
Deciso correta
(1-o)
Investe na campanha do candidato
XYZ e este no se elege
Erro de Tipo II
(|)
Rejeitar a hiptese
(no investir na
campanha do
candidato)
No investe na campanha do
candidato XYZ e este se elege
Erro de tipo I
(o)
No investe na campanha do
candidato XYZ e este no se elege
Deciso correta
(1-|)


Tabela 14. Quadro comparativo da formulao de hipteses

Postura otimista Postura pessimista
Hiptese nula
Hiptese alternativa
H
o
: t = 0,50
H
1
: t < 0,50
H
o
: t = 0,50
H
1
: t > 0,50
Erro de tipo I
Alfa (o)
No investe na campanha do
candidato XYZ e este se elege
Investe na campanha do candidato
XYZ e este no se elege
Erro de tipo II
Beta (|)
Investe na campanha do candidato
XYZ e este no se elege
No investe na campanha do
candidato XYZ e este se elege
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

120
Da forma como foram formuladas as hipteses, o pior erro seria investir na campanha e o
candidato no se eleger e, neste caso, a postura pessimista mais adequada, posto que o
controla.

Operacionalizando a postura pessimista:

Passo 1: Formular as hipteses:
H
o
: t = 0,5
H
1
: t > 0,5

Passo 2: A estatstica a ser utilizada ser a proporo amostral, onde o cuidado deve ser
trabalhar com grandes amostras. Sob a hiptese de nulidade






Passo 3: Para o=5%, determinar a regio de rejeio e aceitao. O valor Z
o
= + 1,645
A regio crtica estar formada por todos os valores maiores ou iguais a +1,645

Passo 4: Calcular a estatstica da amostra. Suponha que voc tenha entrevistado 900
pessoas, das quais 459 eleitores afirmaram que votariam no candidato XYZ.
Logo, p barra igual a 0,51, substituindo na frmula:






Passo 5: Tomar a deciso. Como o valor da amostra foi 0,60 (Z
amostra
= 0,60) menor que o
valor crtico (Z
o
= + 1,645), aceita-se H
o.
Ou seja, voc como assessor do grupo
financeiro, recomendar no investir no candidato XYZ









- 0 +
Z
amostra
=0,60 Z
o
= + 1,645

Ou seja, apesar do candidato ter 51% dos votos, essa margem no suficiente para decidir
apoi-lo.

No investir
no candidato XYZ

RR: investir no
candidato XYZ
o=5%
p N
n
o
o o
~ ( ,
*( )
) t
t t 1

Z
p
n
o
o o
=

t
t t ( ) 1

Z
amostra
=

= =
0 51 0 50
0 50 0 50
900
0 01
0 016667
0 6
, ,
, * ,
,
,
,
Cuidado: para evitar confuso trabalhe tudo
em tanto por um ou tudo em tanto por cento,
nunca misture essas duas formas.
RA
1o=95%
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

121
Agora, raciocinemos ao contrrio: qual teria que ser o valor da proporo amostral tal que
rejeitemos H
o
, ou seja, decidir apoiar o candidato, com um nvel de 5%.

p
c
=? tal que P( p > p
c
) = o

Podemos mostrar que p
c
> t
o
+ Z
o
* t
o
(1t
o
)/n

No nosso exemplo p
c
> 0,5 + 1,645* 0,5*0,5/900
p
c
> 0,5 + 0,0274
p
c
> 0,5274

Ou seja, em uma amostra de 900 eleitores, o candidato XYZ teria que ter pelo menos
52,74% das intenes de votos, o que equivale a 475 eleitores.


A relao entre teste de hipteses e intervalos de confiana

Voc j deve ter reparado que sempre estamos usando a mesma formula, tanto para testar
uma hiptese, quanto para construir intervalos de confiana, para um parmetro
determinado.

IC em funo de mdia amostral IC sob a hiptese de nulidade

X-Z
o/2
-o/Vn X X-Z
o/2
-o/Vn
o
-Z
o/2
-o/Vn
o

o
-Z
o/2
-o/Vn


Checar se
o
est contido no intervalo Checar se X est contida no intervalo


Construamos um intervalo de confiana, de 95% para o caso da lanchonete (pgina 115):
H
o
: = 2000 No construir o posto
o
= 2000
H
1
: > 2000 Construir o posto

Neste caso, como a hiptese alternativa maior, o intervalo de confiana unicaudal, logo:

L
i
= -
L
s
=
o
+ Z
o
* s / n L
s
= 2000 + 1.645*200 / 5,47723 L
s
= 2060

Como o intervalo de confiana [- ; 2060] inclui o valor da mdia da amostra que 2050,
logo aceitamos H
o
, ou seja, deixamos o dinheiro na poupana.
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

122
6.4 Teste de hiptese para a diferena de duas mdias

Muitas vezes desejamos saber se um novo mtodo de ensino mais eficaz que o mtodo
tradicional, ou se os homens tem desempenho e atitudes mais favorveis frente a
Matemtica do que as mulheres, entre outros. Neste caso, estamos interessados em
comparar se a diferena entre duas mdias estatisticamente significativa ou se essa
diferena se deve apenas ao acaso.

Por exemplo, suponha que desejamos testar se o desempenho dos alunos da escola 1 e 3
podem ser considerados iguais ou no (exemplo da pg. 27, retomado nas pginas 88 e 89).

A varivel em estudo X: notas dos alunos da 5 srie na prova de Matemtica
Hiptese nula
Hiptese alternativa
H
o
:
1
=
3

H
1
:
1
=
3

Erro de tipo I
Alfa (o)
Dizer que existe diferena no desempenho por escola,
quando na realidade no existe diferena
Erro de tipo II
Beta (|)
Dizer que no existe diferena de desempenho,
quando na realidade existe diferena

Poderamos, tambm, querer saber se o desempenho superior mostrado na escola 2 em
relao ao desempenho da escola 1 estatisticamente significativa ou no, neste caso, as
hipteses sero:

H
o
:
1
=
2

H
1
:
1
<
2


Suponha, ainda, que o baixo desempenho dos alunos da escola 1 se deva a influncia de
suas atitudes frente a Matemtica, que tendem ao negativo e que uma alternativa para
desbloquear essa influncia seria o uso de jogos matemticos no ensino. Como voc
poderia propor um estudo da eficcia da proposta? Analisemos:

No caso das escolas, cada uma se constitui em uma populao e de cada uma delas foi
escolhida uma amostra, logo podemos afirmar que as amostras so independentes, pois
vem de populaes independentes. A seleo da amostra na escola 1 no interfere na
seleo das outras escolas e assim por diante.

No caso da proposta, o ensino da Matemtica, via jogos, voc tem dois tratamentos, um o
mtodo tradicional - controle-, e o outro a proposta de introduzir os jogos durante as
aulas experimental ou tratamento - . Observe que voc tem uma nica populao.
Voc pode delinear o experimento de duas formas:

Amostras independentes: alocar aleatoriamente os alunos ao grupo controle e ao grupo
experimental.

Amostras emparelhadas: selecionar uma nica amostra, fazer um pr-teste para saber o
nvel de partida, aplica o novo mtodo e ao final da experincia aplicar um ps-teste para
analisar se houve um ganho significativo. Neste caso, cada aluno atua como seu prprio
controle.
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

123
Caso 1: amostras independentes porque vem de populaes independentes

Populao 1 Amostra 1






Populao 2 Amostra 2






Caso 2: amostras independentes de uma mesma populao porque voc aloca
aleatoriamente os elementos ao tratamento ou ao grupo controle


Amostra 1 tratamento

Populao 1


Amostra 2 controle





Caso 3: amostras emparelhadas, uma nica amostra de uma populao, os sujeitos so
submetidos aos dois tratamentos, via de regra, cada sujeito seu prprio controle:

Populao 1 Amostra 1









antes depois

tratamento

...
... ...
...
...
...
...





...



...
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

124
Qual o melhor delineamento, depende do que voc est trabalhando e das condies de
experimentao.

O problema de trabalhar com amostras independentes que corremos o risco de que no
grupo experimental seja composto por alunos brilhantes e o grupo controle por alunos
normais, ou vice-versa. Neste caso, voc no saber se o melhor desempenho do grupo
experimental se deve ao mtodo ou a amostra. A aleatorizao minimiza este risco, porm,
nem sempre voc tem condies ideais de experimentao, uma vez que existem fatores
alheios ao seu controle, como, por exemplo, as turmas j esto formadas desde o incio do
ano, a influncia do professor da turma, turmas com melhor desempenho que outras,
enfim, inmeros fatores que podem contaminar ou confundir o experimento.

O problema de trabalhar com amostras emparelhadas que voc nunca saber se o melhor
desempenho se deve ao novo mtodo ou se apenas efeito do prprio desenvolvimento
cognitivo do aluno. Por essas razes existem vrias modelos para o delineamento
experimental (ver Tabela 15).

Segundo Costa Neto (1977) uma amostra emparelhada quando os resultados esto
relacionados dois a dois segundo algum critrio que introduz uma influncia marcante
entre os diversos pares, que supomos, porm, influir igualmente sobre os valores de cada
par.

O exemplo dado pelo autor muito ilustrativo: 20 cobaias foram submetidas durante uma
semana a uma dieta com certo tipo de rao. Os pesos das cobaias so medidos no incio e
no fim do tratamento, e desejamos tirar concluses sobre o aumento mdio de peso
verificado. Se os animais forem perfeitamente idnticos, teremos duas amostras do tipo
antes e depois, e os dados sero emparelhados, pois cada valor da primeira amostra
estar perfeitamente associado ao respectivo valor da segunda amostra. O critrio que
garante o emparelhamento a identidade de cada cobaia. Note-se que razovel esperar
que a identidade de cada animal tenha influncia nos valores observados de seu peso,
porm essa influncia deve exercer-se de forma aproximadamente igual dentro de cada
par de valores antes e depois; logo, ao se tomarem as diferenas entre os vrios pares
de valores, a influncia individual de cada animal tende a desaparecer, restando apenas
os efeitos produzidos pela rao. Neste exemplo, se os animais no fossem identificados,
no haveria como associar os valores de duas amostras

Este exemplo clssico dos delineamentos experimentais, onde o pesquisador pode
controlar fatores externos ao experimento, de tal forma a garantir que o ganho de peso seja
apenas fruto da rao. Observe que em teoria, as cobaias no devem alterar seu
comportamento para agradar o experimentador, nem o experimentador pode influenciar
nas respostas das cobaias. O experimentador pode escolher cobaias com peso inicial
similar, esta varivel fcil de ser medida e de ser isolada de outros fatores, etc.

Isto no acontece na pesquisa com alunos, onde esses podem tentar agradar ou prejudicar o
professor, o experimentador pode influenciar nas respostas dos alunos, o instrumento de
medida pode no estar medindo o que se deseja, os alunos de um grupo podem interagir,
ou seja, uma srie de elementos podem influenciar a validade interna do delineamento (ver
Tabelas 15 e 16).
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

125
Tabela 15. Os modelos da Pesquisa Experimental: experimentao provocada
12

(quando o pesquisador tem um controle muito grande sobre a varivel independente)

Modelos
experimentais
Viesses podendo afetar a
validade interna
Viesses podendo afetar a validade externa
Pr-teste, ps-teste
com grupo controle
aleatrio

R:O
1
X O
2
(Exp)
R:O
1
O
2
(Cont)



4. Mortalidade experimental


Teste t - amostras emparelhadas
(dentro do grupo)
Teste t - amostras
independentes
(entre grupos)
9. Contaminao
10. Reaes compensatrias
11. Desejo de agradar o examinador
13. Intervenes compensatrias
14. Expectativa do experimentador
15. Interao entre a interveno e a situao
experimental
16. Interao entre os diferentes componentes
de uma interveno
17. Interao entre as observaes e a interveno
18. Interao entre a seleo dos indivduos e a
interveno
Modelo de Solomon
com quatro grupos
R: O
1
X O
2
(Exp)
R: O
1
O
2
(Cont)
R: X O
2
(Exp)
R: O
2
(Cont)
4. Mortalidade experimental

Teste t - amostras emparelhadas
(dentro do grupo)
Teste F ANOVA
(entre grupos)
Idem ao primeiro modelo, menos 17
Ps-teste somente com
grupo-controle
aleatrio
R: X O
2
(Exp)
R: O
2
(Cont)
4. Mortalidade experimental

Teste t - amostras
independentes
(entre grupos)
Idem ao primeiro modelo, menos 17
R: aleatrio, X: interveno, Oi: Observao da ou das variveis dependentes do perodo


Modelos quase-experimentais Viesses podendo afetar a
validade interna
Viesses podendo afetar a validade
externa
Pr-teste, ps-teste com grupo
controle no equivalente

O
1
X O
2

6. Seleo
7. Interao

Teste t - amostras independentes
(entre grupos)
Idem ao primeiro modelo
Experimentao contra-
balanceada ou quadrado latino

G1: Xa O
1
Xb O
2
Xc O
3
Xd O
4
G2: Xb O
1
Xd O
2
Xa O
3
Xc O
4

G3: Xc O
1
Xa O
2
Xd O
3
Xb O
4

G4: Xd O
1
Xc O
2
Xb O
3
Xa O
4

Interaes


Teste F ANOVA
(entre grupos)

(medidas repetidas -MANOVA)
Idem ao primeiro modelo
Ciclo institucional com anlise
transversal/longitudinal

G1: X O
2
O
3
O
4
(Exp1)

G2: O
2
X O
3
O
4
(Exp2)
G3: O
3
O
4
(Cont)
A validade do modelo para cada
grupo fraca. A validade do
modelo resulta da coerncia dos
resultados obtidos para
diferentes grupos.
Teste F ANOVA
(entre grupos, medidas
repetidas-MANOVA)
11. Desejo de agradar o examinador
14. Expectativa do experimentador
15. Interao entre a interveno e a
situao experimental
16. Interao entre os diferentes
componentes de uma interveno
18. Interao entre a seleo dos
indivduos e a interveno
Gi: Grupos no aleatrios, Xi: interveno, Oi: Observao da(s) variveis dependentes do perodo

12
Extrado do Quadro 4.3 do Livro de Contandriopoulus e outros, pgina 51
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

126
Tabela 16. Os modelos da Pesquisa Experimental: experimentao invocada
13


Estudos comparativos
ex-post
Viesses podendo afetar a validade
interna
Viesses podendo afetar a validade externa
Somente ps-teste

X O
2
(Exp)



1.Histria
2. Maturao
3. Familiarizao com o teste
4. Mortalidade experimental
6. Seleo

Teste para uma mdia
12. Relao casual ambgua
14. Expectativa do experimentador
15. Interao entre a interveno e a situao
experimental
16. Interao entre os diferentes componentes
de uma interveno
18. Interao entre a seleo dos indivduos e a
interveno

Somente ps-teste com
grupo controle no
Equivalente

X O
2
(Exp)
O
2
(Controle)

2. Maturao
4. Mortalidade experimental
6. Seleo
7. Interaes

Teste t - amostras independentes
(entre grupos)

Idem ao modelo anterior
Estudo pr/ps

O
1
X O
2
(Exp)



1. Histria
2. Maturao
3. Familiarizao com o teste
7. Interaes
8. Medio dos efeitos

Teste t amostra emparelhada
(dentro do grupo)

Idem ao modelo anterior +
17. Interao entre a seleo dos indivduos e a
interveno
Pr-teste, ps-teste com
grupo controle no
equivalente

O
1
X O
2
(Exp)
O
1
O
2
(Controle)

4. Mortalidade experimental
5. Regresso at a mdia
7. Interaes

Teste t - amostras emparelhadas
(dentro dos grupos)
Teste t - amostras independentes
(entre grupos)

11. Desejo de agradar o examinador
14. Expectativa do experimentador
15. Interao entre a interveno e a situao
experimental
16. Interao entre os diferentes componentes
de uma interveno
18. Interao entre a seleo dos indivduos e a
interveno
Grupos no aleatrios, X: interveno, Oi: Observao da(s) variveis dependentes do perodo, ___ o grupo
controle no criado por distribuio aleatria.


Portanto, antes de levantar os dados examinar qual o modelo mais conveniente para sua
pesquisa.

O Teste F ANOVA (Anlise de varincia) utilizado quando vamos comparar trs ou
mais mdias.


13
Extrado do Quadro 4.4 do Livro de Contandriopoulus e outros, pgina 54. Pesquisa invocada, segundo
esses autores, ocorre quando o pesquisador no pode manipular a varivel independente e utiliza variaes
naturais ou acidentais (no organizadas por ele mesmo) desta varivel, numa lgica anloga aquela do
mtodo experimental, para medir os efeitos sobre uma ou mais variveis dependentes.

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

127
Fatores a serem levados em considerao para a escolha do teste adequado para o teste de
diferena de duas mdias:





Emparelhadas
(Paired-samples)


Amostras

Desvios padres
Conhecidos: o
1
, o
2


Independentes
(Independent-samples)
Podem ser considera-
dos iguais o
1
= o
2

Desvio padro
desconhecidos
o
1
=? e o
2
=?

No podem ser conside-
rados iguais: o
1
= o
2



6.4.1 Amostras emparelhadas.

Dez cobaias adultas foram submetidas ao tratamento com uma nova rao durante uma
semana. Os animais foram perfeitamente identificados, tendo sido mantidos, para tanto, em
gaiolas individuais, obtendo-se os pesos, em gramas, no princpio (X) e no fim (Y) de
semana. O que desejamos saber se a nova rao aumenta significativamente o peso das
cobaias, logo podemos formular as hipteses da seguinte forma:


Conceitos Notao Definio
Populao Cobaias
Amostra As cobaias selecionadas
Varivel X, Y
d = X - Y
X: Peso inicial das cobaias, Y: peso final das cobaias
d = diferena do peso final e peso inicial
Parmetros
Mdia Populacional

d
: mdia da diferena entre o peso final e inicial
Estimador d barra, mdia da diferena do peso final e inicial da amostra
Estimativa valor da mdia das diferenas daquela amostra


Formulando as hipteses:

H
o
:
x
=
y
H
o
:
x
-
y
= 0
H
1
:
x
<
y
H
1
:
x
-
y
< 0

H
o
:
d
= 0 onde
H
1
:
d
< 0 d = X - Y



VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

128
Para evitar ter que trabalhar com a cauda inferior e com muitas diferenas negativas,
aconselhvel fazer a diferena do peso final e o peso inicial, assim voc trabalhar sempre
com a cauda superior e ter menos diferenas negativas. Cuidado ao calcular a mdia e os
desvios, o sinal no pode ser esquecido.

Neste caso as hipteses sero:
H
o
:
d
= 0 onde d = Y - X
H
1
:
d
> 0

A estatstica a ser utilizada ser:






Onde:
t
amostra
tem uma distribuio t-student com n-1 graus de liberdade,
n o nmero de sujeitos (pares)
d barra a mdia da diferena
s
d
o desvio padro da diferena
A em geral igual a zero, mas pode tomar qualquer valor

A regio de rejeio ser determinada por uma t-student com 9 graus de liberdade, para
o=5%, t
o
=1,833












- 0 +
t
5
=+1,833 t
1
=+2,821

Operacionalizando a estatstica da amostra: t
amostra
=2,96


d barra = 6,6
sd=7,043


Como t
amostra
cai na regio de rejeio, conclumos que a rao aumenta o peso das cobaias.
t
d
s n
amostra
d
=
A


RR: a rao aumenta o
peso das cobaias
RA: a rao no aumenta
o peso das cobaias
o=5% o=1%
t
9

t
amostra
d
=

=
6 6 0
7 043 10
2 96
,
,
,

t-student com n-1 gl

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

129
Tabela de dados:

Cobaia
I
Peso antes
Xi
Peso depois
Yi
Diferena
di=Yi-Xi
1 635 640 5
2 704 712 8
3 662 681 19
4 560 558 -2
5 603 610 7
6 745 740 -5
7 698 707 9
8 575 585 10
9 633 635 2
10 669 682 13
Soma - - 66


No SPSS criar um banco de dados contendo apenas o nmero da cobaia, o peso antes e o
peso depois, logo executar os seguintes comandos:

Statistics
Compare means
Paired samples T- test



Sada do SPSS:
- - - t-tests for paired samples - - -

Number of 2-tail
Variable pairs Corr Sig Mean SD SE of Mean
--------------------------------------------------------------------------
X 655,0000 59,200 18,721
10 ,993 ,000
Y 648,4000 58,852 18,611
--------------------------------------------------------------------------


Paired Differences |
Mean SD SE of Mean | t-value df 2-tail Sig
----------------------------------|-------------------------------------
6,6000 7,043 2,227 | 2,96 9 ,016

95% CI (1,561; 11,639) |









2*p-valor
Se o intervalo inclu-se o zero,
aceitaramos a hiptese nula de
igualdade de mdias
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

130
Calculando o p-valor ou o nvel de significncia observado na amostra:

p-valor = P(t
9
> 2,96) = 0,007983 (Calculado com o MINITAB, infelizmente o SPSS
no disponibiliza para o usurio estas funes)


Vejamos como o SPSS calcula o 2-tail Sig:

2-tail Sig = 2*p-valor = 2*0,007983 = 0,015966 = 0,016


Logo o SPSS j fornece o valor para testar igualdade versus diferena, isso significa que se
desejarmos testar hipteses unilaterais, devemos dividir o 2-tail Sig por dois


Observe que o SPSS nos fornece uma anlise completa da relao entre as duas variveis.
Ele calcula o coeficiente de correlao corr, que mede o grau de associao entre duas
variveis. recomendvel fazer o grfico, pois o ganho de peso pode ser diferenciado e
isso pode ser melhor apreciado pelo grfico.


Figura 34. Relao entre o peso inicial e final das cobaias






















O exemplo das cobaias enfrenta um grave problema, que a passagem do tempo. Se as
cobaias estiverem em pleno processo de crescimento, o efeito crescimento natural estar
confundindo o efeito da rao no crescimento. Nesse caso, o experimentador teria que ter
cuidado de trabalhar com cobaias adultas, onde esse fator mnimo, ou usar um grupo
controle.

8 0 0 7 0 0 6 0 0 5 0 0
8 0 0
7 0 0
6 0 0
5 0 0
P r e d i c t e d V a l u e
X
Y
X

Peso depois
Coeficiente de
correlao:
r=0,993

Ho: =0
H1: =0

2-tail sig=0,000

Logo rejeita-se
Ho
Ou seja, existe
correlao entre
as variveis
Peso antes
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

131
6.4.2 Amostras independentes

Um exemplo, muito ilustrativo, a luta dos cientistas contra a AIDS. At hoje no foi
descoberta uma vacina capaz de prevenir a doena. A luta dos pesquisadores se centra em
prolongar o tempo de vida dos pacientes (X) e, nesse sentido, o AZT um medicamento
conhecido, suficientemente testado cuja eficcia est comprovada, porm um
medicamento limitado. Suponha que os cientistas que descobriram o coquetel chegam
at voc, que o diretor do centro de pesquisas, e afirmam que baseado nos resultados
dos experimentos de laboratrio e em alguns pacientes voluntrios, o coquetel mais
eficaz do que o AZT. Voc dever tomar a deciso de liberar ou no o coquetel para o
consumo pelos pacientes portadores da doena.

Este um exemplo de amostras independentes, pois um grupo receber o coquetel
(grupo experimental) e o outro grupo continuar tomando AZT (grupo controle), os
sujeitos devero ser alocados a cada grupo aleatoriamente e cada sujeito no deve saber o
medicamento que est tomando, bem como os examinadores tambm no devem saber
qual tratamento o sujeito est recebendo. Este procedimento chamado de duplo cego e
recomendado para evitar a interferncia de fatores esprios na experimentao.


Conceitos Notao Definio
Populao Pessoas contaminadas pelo vrus HIV
Amostra As pessoas voluntrias que se dispem a participar do experimento
Varivel X Tempo de sobrevivncia aps a contaminao
Parmetros Mdia
populacional

C
: tempo mdio de sobrevivncia com o coquetel (experimental)

AZT
: tempo mdio de sobrevivncia com o AZT (controle)
Estimadores Mdias amostrais e varincias amostrais (corrigidas)
Estimativa valor dos estimadores naquela amostra


Analisemos a situao usando a postura conservadora e a postura inovadora:

Postura conservadora Postura Inovadora
Hiptese nula
Hiptese alternativa
H
o
:
C
=
AZT

H
1
:
C
>

AZT

H
o
:
C
=
AZT

H
1
:
C
>
AZT


Erro de tipo I
Alfa (o)
Liberar o coquetel, porm ele no era
to eficaz quanto o AZT: como o
coquetel ainda no foi suficientemente
testado, no se sabe que problemas
colaterais podem ser causados(*)
No liberar o coquetel, quando ele era
mais eficaz do que o AZT: poderia ter
melhorado a qualidade de vida dos
pacientes

Erro de tipo II
Beta (|)
No liberar o coquetel, quando ele era
mais eficaz do que o AZT: poderia ter
melhorado a qualidade de vida dos
pacientes
Liberar o coquetel, porm ele no era
to eficaz quanto o AZT: como o
coquetel ainda no foi suficientemente
testado, no se sabe que problemas
colaterais podem ser causados
(*) Devemos lembrar o caso da Talidomida que foi liberado para o uso de enxaqueca em mulheres grvidas,
cujos fetos sofreram graves deformaes fsicas. Portanto, a liberao de remdios deve ter necessariamente
o maior tempo de maturao possvel, pois muitos efeitos colaterais s podem ser percebidos no longo prazo.

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

132
Este um caso muito srio na tomada de decises, uma vez que, de um lado, a tomada de
decises pode implicar na morte de pessoas, na qualidade de vidas delas e, de outro lado, a
dificuldade de ampliao dos testes experimentais.

Formulando as hipteses:

H
o
:
1
=
2
H
o
:
1
-
2
= 0 em geral : H
o
:
1
-
2
= A
H
1
:
1
=
2
H
1
:
1
-
2
= 0 H
1
:
1
-
2
= A



Caso 1: Populao normal e com varincias conhecidas:

Varincias diferentes varincias iguais







Caso 2: Populao normal e com varincias desconhecidas:

Varincias iguais Estimativa da varincia (combinada)





gl = n
1
+ n
2
- 2



Caso 3: Populao normal e com varincias desconhecidas:

Varincias diferentes Estimativa dos graus de liberdade





Onde w
1
=s
1
2
/n
1
e w
1
=s
2
2
/n
2



Como a estatstica depende da natureza das varincias envolvidas devemos testar se as
varincias so iguais ou no:


Z
X X
n n
amostra
=

+
( )
1
2
1
2
1 2
2
2
A
o o

Z
X X
n n
amostra
=

+
( )
1
2
1 2
1 1
A
o

t
X X
s n n
amostra
p
=

+
( )
1
2
1 2
1 1
A

s
n s n s
n n
p
=
+
+
( ) ( )
1 1
2
2 2
2
1 2
1 1
2

t
X X
s n s n
amostra
=

+
( )
( )
1
2
1
2
1 2
2
2
A
gl
w w
w n w n
=
+
+ +

( )
/ ( ) / ( )
1 2
2
1
2
1 2
2
2
1 1
2

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

133
Formulando as hipteses: Teste de homogeneidade de varincias

H
o
: o
1
2
= o
2
2
A estatstica F = max (s
1
2
, s
2
2
) rejeitando H
o
se F > Fv
1
,v
2,
o/
2

H
1
: o
1
2
= o
2
2
min (s
1
2
, s
2
2
) onde v
1
o gl do numerador e
v
2
o gl do denominador

Este teste baseado no pressuposto de normalidade da varivel, o que nem sempre pode
ser sustentado. O SPSS calcula o Levene Test que no depende da suposio de
normalidade. Este teste ser apresentado junto com ANOVA Anlise de varincia, no
prximo item.

Observa-se que quando suposio de normalidade no vlida, o tamanho das amostras
deve ser suficientemente grandes, a fim de garantir a convergncia para a normalidade.

Exemplo 1:

A quantidade de um certo elemento no sangue varia segundo o sexo. Para os homens o
desvio padro de 14,1 ppm e para as mulheres 9,5 ppm. Amostras aleatrias de 75
homens e 50 mulheres forneceram mdia de 28 e 33 ppm respectivamente. Pode-se afirmar
que a mdias de concentrao do elemento no sangue o mesma para ambos sexos?


Estatsticas Homens Mulheres
n 75 50
Mdia 28 33
varincia
o
1
=14,1 o
2
=9,5


H
o
:
H
=
M
H
o
:
H
-
M
= 0 A = 0
H
1
:
H
=
M
H
1
:
H
-
M
= 0

Para o=5%, Z
o/2
= 1,96


Figura 35. Regio Crtica
- 0 +
Z
amostra
=2,37 Z
o/2
=-1,96 Z
o/2
=-1,96

o/2=2,5%
%
RA
RR
Z
X X
n n
amostra
=

+
( )
1
2
1
2
1 2
2
2
A
o o

o/2=2,5%
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

134
Como Z
amostra
< -Z
o/2
, rejeita-se Ho, ou seja as mdias no podem ser consideradas iguais.

Calculando o nvel de significncia da amostra:

2-tail sig = 2*p-valor = 2*P(Z < - Z
o/2
)= 2* P(Z < - 2,37)=2*0,0089=0,0178 1,8%

Logo ser rejeitado ao nvel de 5%, mas no ao nvel de 1%


Exemplo 2:

Suponha que voc est estudando a influncia dos jogos matemticos na aprendizagem da
matemtica na 5 srie, para isto voc escolhe duas escolas, com as mesmas caractersticas
scio-econmicas. Em cada escola voc escolhe a melhor turma em matemtica. Em uma
das escolas, sorteada aleatoriamente, voc trabalha com jogos grupo experimental
(certamente voc dever se cercar de todos os cuidados para que as crianas no vejam
voc como um agente estranho) e na outra no grupo controle. No incio do perodo
letivo voc passa um teste - pr-teste - nos dois grupos e ao longo do primeiro semestre
voc trabalha junto com a professora na escola experimental. Encerrado o semestre letivo
voc passa o mesmo teste do incio do ano - ps-teste -.


Estrutura do delineamento:

corte longitudinal
G.Experimental pr-teste inter- ps-teste dif amostra emparelhada
G.Controle pr-teste veno ps-teste dif amostra emparelhada


Corte Amostras amostras
Transversal independentes independentes


Os dados (imaginrios se encontram no banco de dados MEDIAS.SAV)

Grupo: 1=Experimental, 2=Controle
Aluno: cdigo de identificao do aluno
Pos: Nota no ps-teste
Pre: nota no pr-teste
Dif: a diferena das notas no ps-teste e pre-teste, calculado com o comando compute
Variacao: a taxa de variao definido como a diferena dividido pela nota inicial e
multiplicado por 100, para expressar em porcentagem, tambm criado pelo comando
compute
Pre_1: o valor predito para a reta de regresso linear, calculado pelo prprio SPSS

Deve-se ter cuidado ao criar o Banco de da Dados, uma vez que o SPSS precisa da
varivel a ser testada em uma colunas e os grupos em linhas. J o MINITAB (outro
software estatstico) da opes para trabalhar com grupos em colunas.
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

135
Estrutura do Banco de Dados MEDIAS.SAV

GRUPO ALUNO POS PRE DIF VARIACAO PRE_1

1 1 8,50 6,00 2,50 41,67 8,04167
1 2 8,00 5,00 3,00 60,00 7,70833
1 3 9,00 7,00 2,00 28,57 8,37500
1 4 8,50 5,00 3,50 70,00 7,70833
1 5 8,00 6,00 2,00 33,33 8,04167
1 6 9,00 7,50 1,50 20,00 8,54167
1 7 7,50 4,50 3,00 66,67 7,54167
1 8 8,50 7,00 1,50 21,43 8,37500
1 9 7,50 5,00 2,50 50,00 7,70833
1 10 7,00 6,00 1,00 16,67 8,04167
1 11 7,00 7,00 ,00 ,00 8,37500
1 12 6,50 2,00 4,50 225,00 6,70833
1 13 7,50 3,00 4,50 150,00 7,04167
1 14 7,00 4,00 3,00 75,00 7,37500
1 15 8,00 5,00 3,00 60,00 7,70833
1 16 6,50 2,00 4,50 225,00 6,70833
2 1 7,50 6,00 1,50 25,00 7,16745
2 2 7,00 5,00 2,00 40,00 6,37500
2 3 8,00 7,00 1,00 14,29 7,95991
2 4 7,50 5,00 2,50 50,00 6,37500
2 5 8,00 7,50 ,50 6,67 8,35613
2 6 7,00 4,50 2,50 55,56 5,97877
2 7 6,50 5,00 1,50 30,00 6,37500
2 8 6,00 6,00 ,00 ,00 7,16745
2 9 4,00 3,00 1,00 33,33 4,79009
2 10 5,00 4,00 1,00 25,00 5,58255
2 11 6,00 5,00 1,00 20,00 6,37500
2 12 4,00 2,00 2,00 100,00 3,99764


Coloquemos as principais estatsticas:

Grupo n Estatstica Pr-teste Ps-teste Diferena
Experimental 16 mdia
desvio padro
5,13
1,72
7,75
0,82
2,63
1,28
Controle 12 mdia
desvio padro
5,00
1,55
6,38
1,42
1,38
0,77
Geral

28 mdia
desvio padro
5,07
1,62
7,16
1,29
2,09
1,25


Como o tamanho da amostra relativamente pequeno, devemos checar a suposio de
normalidade da nota dos alunos no pr-teste, que devem ter um desempenho similar, como
ponto de partida. Assim devemos fazer uma anlise exploratria dos dados (EXPLORE),
incluindo o teste de normalidade e o grfico de box-plot para ajudar nosso trabalho
exploratrio.






VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

136
Sada do comando Statistics Summarize Explore

PRE

Valid cases: 28,0 Missing cases: ,0 Percent missing: ,0
Mean 5,0714 Std Err ,3061 Min 2,0000 Skewness -,4334
Median 5,0000 Variance 2,6243 Max 7,5000 S E Skew ,4405
5% Trim 5,1071 Std Dev 1,6200 Range 5,5000 Kurtosis -,4404
IQR 1,8750 S E Kurt ,8583
Frequency Stem & Leaf

3,00 2 . 000
2,00 3 . 00
4,00 4 . 0055
8,00 5 . 00000000
5,00 6 . 00000
6,00 7 . 000055

Stem width: 1,00
Each leaf: 1 case(s)

Statistic df Significance

Shapiro-Wilks ,9249 28 ,0538
K-S (Lilliefors) ,1247 28 > ,2000


Uma vez que a suposio de normalidade foi aceita, agora devemos testar a igualdade no
ponto de partida. Neste caso estamos frente a comparao de duas mdias de amostras
independentes, fazendo isto com o SPSS:


Figura 36. Distribuio das notas no pr-teste
















Statistics
Compare means
Independent-Samples T-test
Test variable selecionar as variveis a serem testadas (pr)
Grouping variable selecionar grupo
Group 1: 1
Group 2: 2

1 2 1 6 N =
G R U P O
C o n t r o l e E x p e r i m e n t a l
P
R
E
8
7
6
5
4
3
2
1

Ho: X tem uma distribuio Normal
H1: X no tem uma distribuio normal
Test t:

H
o
:
c
=
e

H
1
:
c
=
e


Teste de Levene:

H
o
: o
1
2
= o
2
2

H
1
: o
1
2
= o
2
2


Podemos trabalhar
com a suposio de
normalidade
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

137
Sada do SPSS

t-tests for independent samples of GRUPO


Number
Variable of Cases Mean SD SE of Mean
PRE

Experimental 16 5,1250 1,718 ,429
Controle 12 5,0000 1,552 ,448

Mean Difference = ,1250


Levene's Test for Equality of Variances: F= ,376 P= ,545


t-test for Equality of Means 95%
Variances t-value df 2-Tail Sig SE of Diff CI for Diff

Equal ,20 26 ,844 ,630 (-1,170; 1,420) Aceitamos Ho
Unequal ,20 25,01 ,842 ,621 (-1,153; 1,403)


Logo podemos considerar as mdias das notas no pr-teste iguais. Agora estamos prontos
para analisar como evoluram os dois grupos. Se quisermos testar simultaneamente as
mdias emparelhadas para os dois grupos, dividir o arquivo com o comando SPLIT:

Data
Split file
Repeat analysis for each group
Group based on Selecionar a varivel grupo

Statistics
Compare means
Paired-Samples T Test
Paired variables selecionar as variveis pos e pre

Sada do SPSS:

GRUPO: 1 Experimental

- - - t-tests for paired samples - - -


Number of 2-tail
Variable pairs Corr Sig Mean SD SE of Mean

POS1 7,7500 ,816 ,204
16 ,701 ,002
PRE 5,1250 1,718 ,429


Paired Differences
Mean SD SE of Mean t-value df 2-tail Sig

2,6250 1,285 ,321 8,17 15 ,000
95% CI (1,940; 3,310)


H
o
:
pos
=
pre
H
o
:
pos- pre
= 0 Logo rejeitamos Ho logo so diferentes
H
1
:
pos
=
pre
H
1
:
pos-pre
= 0
Logo, podemos considerar
igualdade de varincias
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

138
O SPSS sempre fornece o teste bilateral, que no o nosso caso, tendo em vista que
estamos pressupondo que o trabalho com jogos aumenta o desempenho dos alunos e
mesmo que isso no se confirme existe o efeito do desenvolvimento cognitivo da criana.
Logo, as nossas hipteses sero:

H
o
:
pos
=
pre
H
o
:
pos- pre
= 0
H
1
:
pos
>
pre
H
1
:
pos-pre
>0


Logo devemos dividir por dois o valor 2-tail significance, que dar um valor prximo de
zero, o que nos leva a concluso de que o desempenho no ps-teste superior ao
desempenho no pr-teste.


GRUPO: 2 Controle
- - - t-tests for paired samples - - -


Number of 2-tail
Variable pairs Corr Sig Mean SD SE of Mean

POS1 6,3750 1,416 ,409
12 ,868 ,000
PRE 5,0000 1,552 ,448


Paired Differences
Mean SD SE of Mean t-value df 2-tail Sig

1,3750 ,772 ,223 6,17 11 ,000
95% CI (,884; 1,866)


Chegamos a mesma concluso que no grupo experimental, ou seja, tambm houve um
crescimento no grupo controle. Agora, a pergunta em qual dos dois grupos o desempenho
foi melhor, ou o ganho foi superior?


Figura 37. Distribuio da diferena das notas (ps-pr)
















1 2 1 6 N =
G R U P O
C o n t r o l e E x p e r i m e n t a l
D
I
F
5
4
3
2
1
0
- 1

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

139
Aqui devemos fazer o teste para amostras independentes trabalhando com a diferena
entre o ps-teste e pr-teste.


Variable of Cases Mean SD SE of Mean

DIF
Experimental 16 2,6250 1,285 ,321
Controle 12 1,3750 ,772 ,223

Mean Difference = 1,2500

Levene's Test for Equality of Variances: F= 2,360 P= ,137


t-test for Equality of Means 95%
Variances t-value df 2-Tail Sig SE of Diff CI for Diff


Equal 2,98 26 ,006 ,419 (,388; 2,112)
Unequal 3,20 25,02 ,004 ,391 (,445; 2,055)


H
o
:
dife
=
difc

H
1
:
dife
>
difc


Onde:

dife
= mdia das diferenas entre o ps e pre do grupo experimental

difc
= mdia das diferenas entre o ps e pre do grupo controle


Como as varincias podem ser consideradas iguais, o valor a ser lido 2-tail sig=0,006, o
que significa que o p-valor igual a 0,003, ou seja rejeitamos a hiptese nula, permitindo
concluir que o desempenho no grupo experimental foi superior ao do grupo controle.

Analisando com mais detalhe essa relao, vejamos como se relacionam as duas variveis
por grupo, utilizando a anlise de correlao e regresso, que sero estudados com maior
detalhe proximamente. Aqui faremos apenas uma apresentao intuitiva dessa tcnica.


Grupo Experimental Controle
Coeficiente de correlao 0,701 0,868
R Square R
2
49,2% 86,9%
Adjusted R Square R
2
a
45,5% 75,4%
Signif F (p-valor) 0,0025 0,0002
Intercepto (contant) / Sig (p-valor) 6,04 0,0000 2,41 0,0090
Slope (Pr) / Sig (p-valor) 0,33 0,0025 0,79 0,0002


A Figura 38 mostra como se relaciona o desempenho no pr-teste e no ps-teste, por
grupo, tendo j ajustado uma funo linear, com os seguintes resultados:

Grupo Experimental: Ps = 6,04 + 0,33*Pr R
2
= 49,2%
Grupo Controle: Ps = 2,41 + 0,79*Pr R
2
= 75,4%
Geral Ps = 4,52 + 0,52*Pr R
2
= 42,7% (p-valor=0,0002)

Igualdade de
Varincias
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

140
Observe que as duas linhas so diferentes, enquanto que a linha do grupo experimental tem
uma inclinao menor e um intercepto maior, a linha do grupo controle tem uma inclinao
maior e um intercepto menor. Essas linhas mostram a superioridade do desempenho do
grupo experimental. A menor inclinao da linha do grupo experimental mostra que os
grandes beneficiados da introduo dos jogos no ensino de matemtica foram as crianas
que apresentavam maior dificuldade, no incio do semestre.


Figura 38. Relao entre o desempenho nos testes, por grupo


































6.5 Testando a igualdade de mais de duas mdias ANOVA

Muitas vezes nos deparamos com a anlise de desempenho de mais de dois grupos, como,
por exemplo, no caso da pesquisa de Paulnia, temos as atitudes de Matemtica por gnero,
srie, perodo, turma, entre outras variveis relevantes para entender o relacionamento dos
alunos em relao a Matemtica. Suponhamos que gostaramos de saber se as atitudes em
relao Matemtica varia em relao a srie, neste caso as hipteses sero:

Varivel dependente X: Atitude em relao Matemtica (quantitativa, contnua)
que toma valores entre 20 e 80
Varivel independente Y: srie (qualitativa, ordinal)
Que toma valores de 3 a 9, onde 3=5, 4=6,...

Ho:
3
=
4
=
5
=
6
=
7
=
8
=
9
igualdade de mdias a atitude no varia por srie

Ho:
i
=
j
, para algum i =j existe pelo menos duas sries diferentes

8 7 6 5 4 3 2 1
1 0
9
8
7
6
5
4
3

Nota no pr-teste
Nota no ps-teste
Grupo experimental
Grupo controle
VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

141
Com fins didticos apresentaremos um exemplo pequeno e simples (JOGOS.SAV).
Suponha que desejamos testar a validade da introduo dos jogos matemticos e do uso do
computador com softwares matemticos no ensino de matemtica. Para isto delineamos o
seguinte experimento: escolhemos aleatoriamente alunos de uma turma e os alocamos nos
trs grupos:

Grupo controle: Somente as aulas tradicionais controle=1
Grupo experimental 1: As aulas tradicionais, mais jogos matemticos jogos =2
Grupo experimental 2: As aulas tradicionais, mais o uso do computador computador=3

A varivel dependente ser X, nota no teste de avaliao (valores de 0 a 10), no final da
interveno.

As hipteses:

H
o
:
1
=
2
=
3
No existe diferena entre grupos
H
1
:
1
=
2
ou
1
=
3
ou

2
=
3
Existe pelo menos uma diferena


Suponha que os resultados foram:
Alunos (repeties) Grupos
Controle Jogos computador
1 8 7 10
2 7 8 9
3 6 8 9
4 7 9 8
5 7 8 9
Mdia 7 8 9
Soma de quadrados dos desvios 2 2 2
Varincia sem corrigir 2/5 2/5 2/5
Mdia geral 8
Soma de quadrados dos desvios total 16
Varincia geral sem corrigir 16/15

Trabalhando com os desvios:
Nota Controle Jogos Computador Geral

6 1 -1 1 -2
7 3 0 1 -1 4 -1
8 1 +1 3 0 1 -1 5 0 SQTotal
9 1 +1 3 0 4 1 =16
10 1 +1 1 2
Mdia 7 8 9 8
Soma dos desvios
dentro de cada grupo
2 2 2 SQDentro=6
Desvio da mdia do grupo
em relao a mdia total
-1 0 1
Soma dos quadrados dos
desvios entre grupos
5 0 5 SQEntre=10

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

142
fcil mostrar que a varincia total pode ser escrita como sendo a soma da varincia
dentro dos grupos e a varincia entre os grupos:

Varincia geral = varincia entre os grupos + varincia dentro dos grupos
(mdia das varincias dos grupos)

16/15 = 2/3 + 2/5 = 10/15 + 6/15

ou ainda:

Soma dos Quadrados
Total
= Soma de Quadrados
Entre Grupos
+ Soma de Quadrados
Dentro dos Grupos

SQTotal = SQGrupos + SQErro



Em geral, sob os seguintes pressupostos:

1. As k amostras representam amostras independentes provenientes de k populaes com
mdias
1
,
2
...
k

2. Cada uma das k populaes normal
3. Cada uma das k populaes tem a mesma varincia (homocedasticidade)


Pode-se mostrar que as somas de quadrados seguem uma distribuio chi-quadrado com os
seguintes graus de liberdade:

SQTotal ~_
2
n-1
= SQGrupo ~_
2
k-1
+ SQErro ~_
2
n-k



De outro lado sabemos que uma distribuio F o quociente de duas distribuies qui-
quadrados divididos pelos seus graus de liberdade respectivamente, logo:






A pergunta como a estatstica F pode ser usada para testar a hiptese nula de igualdade
de mdias? Pode-se mostrar que a esperana matemtica dos quadrados mdios devidos ao
Grupo e ao Erro tem o seguinte forma:






QMGrupo
QMErro
F
k n k
~
, 1


Onde: QMGupo = SQGrupo / (k-1)
QMErro = SQErro / (n-k)

E QMGrupo
n
k
i i
k
( )
( )
= +

o

2
2
1
1

E QMErro ( ) = o
2

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

143
Logo sob a hiptese nula de igualdade de mdias






Se a hiptese nula for falsa ento este valor deve ser positivo (soma de quadrados). Ou
seja, sob a hiptese nula de igualdade de varincias devemos esperar que os quadrados
mdios entre grupos e devido ao erro estejam prximos , assim a estatstica F deve ser
prxima de 1, se a hiptese for falsa esperamos que o QMGrupos seja maior que o
QMErro:

Se H
o
:
1
=
2
=
3
(no existe diferena entre grupos) for verdadeira F entre 0 e 1
Se H
o
: for falsa QMGrupos > QMErro F > 1

A estatstica F ter apenas uma regio de rejeio, a cauda superior. Assim podemos
construir a Tabela de Anlise de Varincia

Tabela de Anlise de Varincia ANOVA (um critrio de classificao ONE WAY)

Fonte de variao Graus de
liberdade
Soma de
quadrados
Quadrados
mdios
F F prob
p-valor
Entre grupos k-1 SQGrupo QMGrupo F
a
P(F > F
a
)
Dentro dos grupos n-k SQErro QMErro
Total n-1 SQTotal

F
a
o valor encontrado na amostra, a estatstica F ter uma distribuio F de Snedecor com
k-1 graus de liberdade (nmero de grupos menos um) no numerador e n-k graus de
liberdade no denominador (nmero de sujeitos menos o nmero de grupos).

Analisando a estatstica F:

Se tivssemos k grupos diferentes, porm perfeitamente homogneos dentro de si, a
varincia dentro dos grupos ser igual a zero e a varincia total estaria explicada apenas
pela diferena entre os grupos - varincia entre grupos -, logo a estatstica F tenderia para
infinito, concluindo que a varincia se devia a diferena entre grupos.

E, se ao contrrio, todos os grupos tivessem exatamente a mesma mdia, ento a varincia
entre grupos seria igual a zero, logo a estatstica F tomaria o valor zero, concluindo que a
varincia total se devia a variao interna dos grupos e no a diferena entre grupos.

Assim a estatstica F varia de zero at infinito e quanto mais prximo de zero e de um,
menor a evidncia de diferenas entre os grupos e quanto maior que 1, maior a evidncia
da diferena entre grupos.

n
k
i i
k
( )

1
2
1
0

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

144
Calculemos a ANOVA no nosso exemplo dos trs grupos:

Tabela de Anlise de Varincia ANOVA (um critrio de classificao ONE WAY)

Fonte de variao Graus de
liberdade
Soma de
quadrados
Quadrados
mdios
F F prob
p-valor
Entre grupos 2 10 5,0 10 0,0028
Dentro dos grupos 12 6 0,5
Total 14 16

Logo rejeitamos Ho, concluindo que existe diferena entre os grupos. Agora s falta saber
entre quais grupos existe diferena, para isso temos que fazer as comparaes mltiplas.


Use o Banco de Dados JOGOS.SAV
Statisticis
Compare means
One-Way ANOVA
Dependent list selecionar a varivel dependente nota
Factor selecionar a varivel indpendente grupo(*)
Define range: Minimum: 1
Maximum: 3
Post Hoc Comparaes multiplas Tuckey...
Options Descritive
Homogeneity of variances Levene test

Sada do SPSS
- - - - - - - - - - - - - - - - - - - - O N E W A Y - - - - - - - - - - - - - - - - -

Variable NOTA
By Variable GRUPO

Analysis of Variance

Sum of Mean F F
Source D.F. Squares Squares Ratio Prob.

Between Groups 2 10,0000 5,0000 10,0000 ,0028
Within Groups 12 6,0000 ,5000
Total 14 16,0000



Standard Standard
Group Count Mean Deviation Error Minimum Maximum 95 Pct Conf Int for Mean

Grp 1 5 7,0 ,7071 ,3162 6,0 8,0 6,1220 TO 7,8780
Grp 2 5 8,0 ,7071 ,3162 7,0 9,0 7,1220 TO 8,8780
Grp 3 5 9,0 ,7071 ,3162 8,0 10,0 8,1220 TO 9,8780

Total 15 8,0 1,0690 ,2760 6,0 10,0 7,4080 TO 8,5920


Levene Test for Homogeneity of Variances

Statistic df1 df2 2-tail Sig.
,0000 2 12 1,000



_____________
(*) Por esta razo, que a varivel dependente deve ser colocada no SPSS de forma numrica,
de preferncia utilizando nmeros consecutivos.

VI. Teste de hipteses
Apostila de Estatstica
Prof Irene Mauricio Cazorla

145
Sada para as comparaes mltiplas:

- - - - - - - - - - - - - - - - - O N E W A Y - - - - - - - - - - - - - - - - - - - - - -

Variable NOTA
By Variable GRUPO

Multiple Range Tests: Tukey-HSD test with significance level ,050

The difference between two means is significant if
MEAN(J)-MEAN(I) >= ,5000 * RANGE * SQRT(1/N(I) + 1/N(J))
with the following value(s) for RANGE: 3,77

(*) Indicates significant differences which are shown in the lower triangle

G G G
r r r
p p p
1 2 3
Mean GRUPO

7,0000 Grp 1
8,0000 Grp 2
9,0000 Grp 3 *

Homogeneous Subsets (highest and lowest means are not significantly different)

Subset 1
Group Grp 1 Grp 2
Mean 7,0000 8,0000
- - - - - - - - - - - - - - - - -
Subset 2
Group Grp 2 Grp 3
Mean 8,0000 9,0000
- - - - - - - - - - - - - - - - -

A sada das comparaes mltiplas est dada em forma de uma matriz simtrica, cuja
diagonal corresponderia a comparar o grupo com ele mesmo, por tanto devemos ler apenas
a diagonal inferior. Na clula onde existe um asterisco significa que existe diferena entre
esses grupos, caso contrrio, os grupos podem ser considerados iguais.

Mdia Grupo Grupo1
Controle
Grupo2
Jogos
Grupo3
computador
7 1=Controle
8 2=Jogos
9 3=Computador *

Neste caso, podemos afirmar que o grupo do computador teve um desempenho superior ao
controle, mas no diferente ao grupo dos jogos, o mesmo acontece com o grupo dos
jogos que no se diferencia do grupo controle.

6.5.1 Comparaes Mltiplas

Existe um problema srio para detectar os grupos diferentes, uma vez que existem
k*(k-1)/2 possveis comparaes, e o nvel de significncia aumenta a medida que aumenta
k o nmero dos tratamentos, por esta razo tomar cuidado ao se realizar estes testes.

Levene Test. Para testar homogeneidade de varincias, o Levene Test calcula o valor
absoluto dos desvios dos valores da varivel em relao a mdia do grupo e realiza o
ANOVA-One Way.

Você também pode gostar