Você está na página 1de 9

Teste de Hipteses

Estudaremos outro aspecto de inferncia estatstica: o Teste de Hipteses.



Objetivo: Decidir se uma conjectura sobre determinada caracterstica de uma ou mais populaes , ou no,
apoiada pela evidncia obtida dos dados amostrais. Tal conjectura o que se chama hiptese estatstica, e a
regra usada para decidir se ela verdadeira ou no o teste de hiptese.
Os testes de hipteses permitem-nos tomar decises em presena da variabilidade, ou seja, verificar se estamos
diante de uma diferena real (significativa) ou de uma diferena devida simplesmente flutuao aleatria ao
processo.

Hiptese estatstica: Uma hiptese estatstica, que denotaremos por H, qualquer afirmao sobre a populao
em estudo.
Na formulao de um teste de hipteses, duas hipteses so definidas. A hiptese de investigao, Ha,
denominada hiptese alternativa e a hiptese nula, H0, que consiste na negao de Ha. Ento, o teste de
hipteses consiste numa regra de deciso entre H0 e Ha. Nesta regra de deciso so utilizadas as informaes
obtidas na amostra.

Exemplo:
1) Um pesquisador deseja estudar o efeito de certa substncia no tempo de reao de seres vivos a um certo tipo
de estmulo. Um experimento desenvolvido com cobaias que so inoculadas com a substncia e submetidas a
um estmulo eltrico, com seus tempos de reao (em segundos) anotados. Admite-se que o tempo de reao
segue, em geral, o modelo N(8 seg; 2 seg). O pesquisador desconfia, entretanto, que o tempo mdio sofre
alterao por influncia da substncia.
Neste caso, as hipteses de interesse so:
H
0
: as cobaias apresentam tempo de reao padro
H
a
: as cobaias apresentam tempo de reao alterado
Em termos estatsticos, tais hipteses envolvem o parmetro e podem ser escritas como:
H
0
: =8,0 seg
Ha: 8,0 seg

Por convenincia tcnica, sempre, deixamos a igualdade na hiptese nula e em Ha a hiptese que desejamos
investigar.
Queremos decidir entre H
0
e H
a
.
Em todo processo de deciso existe a chance de uma deciso errada. Neste processo de deciso dois tipos de
erro so possveis, como mostra o quadrado seguinte.

Erros possveis associados a teste de hipteses


Podemos rejeitar H
0
quando H
0
verdadeira, que consiste no erro tipo I e podemos no rejeitar H
0
quando H
0

falsa, que consiste no erro tipo II.
No exemplo anterior, estes dois erros so:
Erro tipo I: concluir que as cobaias apresentam tempo de reao alterado quando na verdade ele no concluir
que 8 quando na verdade =8.
Erro tipo II: concluir que as cobaias apresentam tempo de reao padro quando na verdade ele concluir que
=8 quando na verdade 18.

As probabilidades do erro tipo I e do erro tipo II serem cometidos so, respectivamente:
o =P(erro tipo I) =P(rejeitar H
0
| H
0
verdadeira) =nvel de significncia do teste
| =P(erro tipo II) =P(no rejeitar H
0
| H
0
falsa)
Os dois tipos de erro so indesejveis.
Para um tamanho de amostra fixo, isto , coletados os dados, no possvel controlar os dois erros
simultaneamente.
Ento, queremos encontrar uma regra de deciso entre H
0
e H
a
tal que o erro tipo I seja controlado.

Vamos controlar este erro pr-fixando a probabilidade de sua ocorrncia em um valor a pequeno.
O valor de o estabelecido pelo pesquisador. usual trabalhar com valores de o menores ou iguais a 5%, sendo
que o mais comum o de 5% (a =0,05).

A capacidade de um teste identificar diferenas que realmente existem, ou seja, de rejeitar H
0
quando realmente
falsa, denominada poder do teste e definida como 1 |.
O poder do teste =P(rejeitar H
0
| H
0
falsa) =1 |.

Etapas para Testar uma Hiptese Estatstica
1. Definir a hiptese nula H
0
e a hiptese alternativa H
a
.
2. Escolher a estatstica de teste adequada.
3. Escolher o nvel de significncia o e estabelecer a regio crtica.
4. Calcular o valor da estatstica de teste com base em uma amostra de tamanho n extrada da populao.
5. Concluir. Rejeitar H
0
se o valor calculado da estatstica est na regio crtica. No rejeitar H
0
em caso
contrrio.

Uma forma alternativa de testar uma hiptese estatstica atualmente mais usada atravs da probabilidade de
significncia ou p-valor.

O p-valor nos fornece a probabilidade, calculada supondo H
0
verdadeira, de que ocorram valores to ou mais
extremos que o observado para a estatstica de teste. Portanto, o p-valor (ou valor p) o menor nvel de
significncia que conduz rejeio da hiptese nula H
0
, calculado com os dados amostrais.

Se p-valor for menor do que o limite tolervel, o, para a probabilidade do erro tipo I, decide-se por rejeitar H
0
. Ou
seja, se p-valor <o rejeitar H
0
.

Interpretaes de p-valor:
p > 0,10 - No existe evidncia contra Ho (H
0
no rejeitada)
p <0,10 - Fraca evidncia contra H
0
(H
0
no rejeitada)
p <0,05 - Evidncia significativa contra H
0
(H
0
rejeitada)
p <0,01 - Evidncia altamente significativa...
p <0,001 - Evidncia muito altamente significativa...







Exemplo: Suspeita-se de que o tempo gasto para a extrao de minrio utilizando-se uma nova tcnica esta
sendo maior do que o tempo gasto com a tcnica padro, que em mdia 69,8 h. sabido, de estudos anteriores,
que o tempo gasto com a nova tcnica tem distribuio normal com desvio-padro de 1,86 h. Para verificar essa
suspeita, foram feitas 50 extraes utilizando-se a nova tcnica e o tempo gasto em cada uma delas foi medido,
obtendo-se mdia igual a 70,59 h.
Soluo:
Deseja-se testar se o tempo gasto com a nova tcnica superior ao tempo gasto com a tcnica padro.
Isto , queremos testar se: H
0
: =69,8 versus Ha : >69,8 (teste unilateral direito).
Temos que: s =1,86, n =50
Como os dados so de uma distribuio normal com s conhecido usamos a estatstica de teste Z.







RC.: Zobs >zo , para a =0,05 RC.: Zobs >1,64




Logo, h evidncias de que o tempo gasto para extrao de minrio com a nova tcnica maior que o tempo
gasto com a tcnica padro, ao nvel de significncia o de 5%.

p-valor =P(Z>3,00) =0,5 - P(0<Z<3,00) =0,5 - 0,4987 =0,0013. Assim, a hiptese H
0
de que o tempo gasto com
a nova tcnica no superior ao tempo gasto com a tcnica padro (H : =69,8) seria rejeitada com qualquer
nvel de significncia o maior que o valor p encontrado (o >0,0013).
Para o =0,05, temos 0,0013 <0,05 evidncias muito altamente significativas contra H
0


00 , 3
50
86 , 1
80 , 69 590 , 70
=

=
obs
Z
n
X
Z


Como Zobs > 1,64, conclui-se que
existem evidncias amostrais para se
rejeitar Ho, ao nvel de significncia o =
5%.






Exemplo1: Um teste de resistncia ruptura feito em uma amostra de seis cordas acusou resistncia mdia de
3770 kg com desvio padro de 66 kg. O fabricante afirma que seu produto tem resistncia mdia superior a 3650
kg. Considerando que a resistncia ruptura da populao de cordas segue uma distribuio normal, pode-se
justificar a alegao do fabricante, no nvel de significncia de 1%?

O teste de interesse :
H
0
: A alegao no vlida
H
a
: A alegao do fabricante vlida

Isto ,
H
0
: =3650 versus H
a
: >3650.

Sendo o
2
desconhecido usaremos o estimador S
2
.

Assumindo que a amostra de 6 cordas de uma populao N( ; o), usaremos a estatstica de teste T, pois o
desconhecido e n pequeno








RC.: T
obs
>t
o
;
n-1


Para o =0,01 e v =n - 1 =6 - 1 =5 graus de liberdade t
5, 0,01
=3,365 (valor encontrado na tabela da distribuio
t).
RC.: Tobs >3,365



Portanto, como T
obs
pertence RC, decidimos pela rejeio da hiptese nula, ou seja, a alegao do fabricante
provvel, ao nvel de significncia de 1%.

p-valor =P(T >4,45). Nesse caso no possvel, com a tabela t que temos, determinar exatamente o valor p.
Podemos afirmar que menor que 0,005 (probabilidade correspondente a t =4,032 com 5 gl). Assim, a hiptese
H
0
seria rejeitada com qualquer nvel de significncia o maior que o valor p.
Considerando o nvel de significncia o =0,01, rejeitamos H
0
, pois p <0,01.

Exemplo 2:Deseja-se investigar se uma molstia que ataca o rim altera o consumo de oxignio desse rgo. Para
indivduos sadios, admite-se que esse consumo tem distribuio Normal com mdia 12 cm3/min. Os valores
medidos em 16 pacientes com a molstia foram: 14,4; 12,9; 15,0; 13,7; 13,5; 14,6; 13,0; 13,7; 14,5; 14,8; 13,9;
14,0; 14,3; 15,0; 13,3 e 12,9. Qual seria concluso, ao nvel de 1% de significncia?
O teste de interesse :
H
0
: A molstia no altera a mdia de consumo renal de oxignio
H
a
: Indivduos portadores da molstia tm mdia de consumo renal de oxignio alterada

Isto ,
H
0
: =12 versus H
a
: 12.

Sendo o
2
desconhecido usaremos o estimador S
2
.





( ) ( )
1 1
2 2
2

=

n
x x
S
n
x x
S
i i
n
s
X
T

=
66 3770 = = S X
45 , 4
6 66
3650 3770
=

=
obs
T
Assumindo que a amostra de 16 pacientes de uma populao N( ; o), usaremos a estatstica de teste T.







p-valor =2P(T>|T
obs
|) =2P(T>|10,893|) , olhando na tabela t, para v =15, temos que o valor de p ser muito menor
que 0,005, pois o maior valor de t, na tabela, 2,947. p deve ser ~ 0. Assim, a hiptese H
0
seria rejeitada com
qualquer nvel de significncia o

Suponha que o interesse do pesquisador, no exemplo anterior, era verificar se a molstia que ataca o rim aumenta
o consumo de oxignio desse rgo.

O teste realizado nesse caso o unilateral direito.

H
0
: =12 Ha : >12.

RC.: Tobs >to ; n-1

Para o =0,01 e n =15 t
0,01 ; 15
=2,602 , RC.: Tobs >2,602





p-valor =P(T >10,893) <<0,005, pela tabela da distribuio t de Student com 15 graus de liberdade. Assim, a
hiptese H
0
seria rejeitada com qualquer nvel de significncia o

Ou, como T
obs
=10,893 pertence regio crtica, H
0
rejeitada ao nvel de significncia de 1%. Isto , os dados
confirmam a hiptese de que a molstia aumenta o consumo mdio de oxignio no rim, ao nvel de significncia o
=0,01.
n
s
X
T

=
893 , 10
16 723 , 0
12 969 , 13
=

=
obs
T






Exemplo: Um laboratrio farmacutico introduz no mercado um novo comprimido contra dor de cabea, retirando
de circulao o antigo, com a justificativa de que o novo produto tem ao mais rpida. O remdio que estava no
mercado tem um tempo mdio de 37 minutos para o incio do efeito. Em uma amostra de 34 pessoas que
tomaram o novo comprimido, obteve-se um tempo mdio de 36 minutos, com desvio padro de 4 minutos. Ao
nvel de significncia de 5% podemos afirmar que o novo comprimido tem ao mais rpida?
Soluo:
H
0
: =37 (o novo comprimido no melhor que o antigo)
Ha : <37 ( o novo comprimido tem ao mais rpida que o antigo)
Estamos diante de uma situao em que no conhecemos a distribuio, mas o tamanho da amostra, n =34,
pode ser considerada grande. Devemos, pois, usar o Teorema Central do Limite.


Pela tabela da distribuio Normal, z
0,05
=-1,64. Ento, a RC dada por: Z <-1,64.
O valor de Z calculado, Z
obs
, com base na amostra no est na regio de rejeio, RC. Logo, no rejeitamos H
0
e
conclumos que o tempo mdio de ao do novo comprimido no inferior ao tempo mdio de ao do
comprimido que estava no mercado, ao nvel o =0,05.

Utilizando o p valor, teramos: p =P(Z <-1,46) =0,5 - 0,4279 =0,0721. Assim, a hiptese H
0
seria rejeitada com
qualquer nvel de significncia o > 0,0721. Para o nvel de significncia o =0,05, temos que p >0,05, portanto no
rejeitamos H
0
.












Exemplo: Um modelo gentico sugere que 80% das plantas oriundas do cruzamento de dois tipos de sementes
sero da variedade an. Aps observar o crescimento de 200 destas plantas, constatou-se que 144 eram ans.
Os dados contradizem o modelo gentico?
Soluo:
Sejam p a proporo de plantas da variedade an e p
0
a proporo sugerida pelo modelo gentico. As hipteses
so:

H
0
: p =p
0
isto H
0
: p =0,80
H
a
: p = p
0
isto H
a
: p = 0,80





Estatstica de teste:



RC.: Z
obs
<- Z
o /2
ou Z
obs
>Z
o/2
.,

Para o =0,05, temos, pela tabela, Z
o/2
=1,96 RC.: Z
obs
<-1,96 ou Z
obs
>1,96.

Como Z
obs
<-1,96, ao nvel de significncia de 5% rejeitamos a hiptese nula, ou seja, os dados contradizem o
modelo gentico.

P-valor =2P(Z>|2,83|) =2.P(Z>2,83) =2(0,5 0,4977) =2.(0,0023) =0,0046. A hiptese H
0
seria rejeitada com
qualquer nvel de significncia o > 0,0046. Portanto, os dados mostram fortes evidncias contra H
0
, contra o
modelo gentico.






72 , 0
200
144
= = p
0,72 0,80
2,83
0,80.0,20
200
obs
Z

= =