Você está na página 1de 9

6 Testes de Hipteses

6.1 Introduo e notao


Em geral, intervalos de confiana so a forma mais informativa de apresentar os achados pricipais de um estudo. Contudo, algumas vezes existe um particular interesse em decidir sobre a verdade ou no de uma hiptese especfica (se dois grupos tm a mesma mdia ou no, ou se o parmetro populacional tem um valor em particular ou no). Teste de hipteses fornece-nos a estrutura para que faamos isto. Veremos que intervalos de confiana e testes de hipteses esto intimamente relacionados.

6.1.1 Os pssaros migratrios engordam antes de migrar?


Considere os dados coletados pelo ornitologista na pgina 15. Achamos apropriado apresentar os dados na forma de um ladder plot. Agora natural perguntar se em mdia estes pssaros engordam entre Agosto e Setembro. Somente 10 pssaros foram capturados e seu peso mdio nas duas ocasies foram 11.47 e 12.35 ento o peso mdio aumentou para esta amostra em particular. (Note que o mesmo conjunto de pssaros foram medidos ambas as vezes.) Podemos generalizar para o resto dos pssaros que no foram capturados? Ser que esta diferena poderia ser devida simplesmente ao acaso? Queremos testar a hiptese nula (H ) de que, em mdia, no existe mudana no peso dos pssaros. Assumiremos que os 10 pssaros foram uma amostra aleatria de todos os pssaros migradores daquela espcie e usaremos primeiramente o que aprendemos sobre intervalos de confiana para responder nossas perguntas. Primeiro vamos calcular as mudanas de peso (Setembro-Agosto):

Seja

a mudana mdia de peso na populao. Ento nossa hiptese nula H

ea

hiptese alternativa H podem ser escritas como segue:

Um procedimento til calcular um intervalo de confiana para a mdia populacional como descrito na Seo 5.5, e ver ser o intervalo inclui 0 como um valor plausvel. Agora , e para as diferenas, ento

e um valor- de 2.262 obtido da coluna intervalo de confiana de 95% para portanto

e linha

. Um

O intervalo no contem o valor 0, fornecendo evidncias contra a hiptese nula. Podemos dizer: ``existem evidncias significativas ( ) de que, em mdia, os pssaros da espcie estudada mudam de peso de Agosto para Setembro. Estamos 95% confiantes de que em mdia os pesos aumentam por um montante entre 0.12 e 1.64 gramas.'' Mas e o intervalo de 99%? Ser que ele conteria o valor 0? Este intervalo seria mais amplo e ento mais provvel que ele contenha 0. Se ele no incluir 0, isto indicaria uma evidncia ainda mais forte contra .

Calculando o intervalo de confiana exatamente da mesma forma, exceto que desta vez precisamos olhar na coluna para obter :

Como esperado, este mais amplo, e agora inclui o valor 0. Podemos agora dizer: ``no existem evidncias significativas ao nvel de 1% de que, em mdia, os pssaros da espcie estudada mudam de peso de Agosto para Setembro.'' O que ns acabamos de fazer foi conduzir um teste perfeitamente vlido para a hiptese nula usando intervalos de confiana. Podemos fazer o teste mais rapidamente e obter exatamente as mesmas concluses pelo seguinte procedimento: Calcule que dista de 0. Compare este valor de com aqueles na linha , o nmero de erros padro da tabela.

Para este exemplo, o qual est entre os valores nas colunas e . Ento nosso valor deve corresponder a um entre estes e portanto devemos ter .( a probabilidade de observar um .)

valor de to grande ou mais extremo do que 2.61 se

6.2 Procedimento geral de teste

1. Estabelea a hiptese nula, H e a hiptese alternativa H . 2. Decida qual oteste a ser usado, checando se este vlido para o seu problema. 3. Calcule a estatstica de teste, T. 4. Encontre a probabilidade (p-valor) de observar um valor to extremo ou maior do que T se a hiptese nula de fato verdadeira. Voc precisar se referir aos valores crticos nas tabelas estatsticas as quais fornecem correspondendo aos valores das estatstica de teste. -valores

5. Avalie a fora da evidncia contra H .(Quanto menor -valor, tanto mais evidncia contra a hiptese nula.) Se necesrio, decida se esta evidncia suficiente para rejeitar (ou no rejeitar) a hiptese nula. 6. Estabelea as concluses e interpretao dos resultados. O -valor a probabilidade de observar dados to extremos quanto os obtidos se a -valores:

hiptese nula verdadeira. Note as seguintes interpretaes de

Esteja ciente da diferena entre significncia estatstica e significncia prtica. Um efeito pode ser estatisticamente significante mas no ter qualquer importncia prtica e vice-versa. Por exemplo, um estudo muito grande pode estimar a diferena entre a mdia de peso de plantas como sendo 0.0001 gramas e concluir que a diferena estatsticamente significativa ( ). Contudo, na prtica, esta diferena negligvel e provavelmente de pouca importncia prtica.

6.3 Teste para uma mdia


Na Seo 5.1.1 conduzimos, atravs de um exemplo, o chamado teste-t para uma nica mdia. Os passos principais de tal test-t para uma amostra aleatria uma populao com mdia so dados a seguir: de

1. Estabelea a hiptese nula, H . 2. Calcule a mdia amostral 3. Calcule o erro padro, SE 4. Calcule a estatstica de teste padro que dista do valor de hiptese

, e a hiptese alternativa H

e o desvio padro amostral .

. Este o nmero de erros .

5. Encontre o -valor da distribuio , com graus de liberdade, da tabela usando os valores absolutos da estatstica de teste. 6. Estabelea concluses e interprete os resultados.

6.4 Teste para uma proporo


Agora suponha que tenhamos um valor hipottico para uma proporo. Podemos

realisar um teste de H praticamente da mesma forma que o test-t acima. A dualidade com intervalos de confiana segue exatamente da mesma forma. Suponha que tenhamos uma amostra aleatria de tamanho de uma populao de .A ,

interesse onde a verdadeira proporo de membros numa categoria em particular hiptese nula H . Se o nmero observado na categoria de interesse ento um teste da hiptese como segue: 1. Estabelea a hiptese nula, H . 2. Calcule a proporo amostral 3. Calcule o erro padro, SE 4. Calcule hiptese . . . , o nmero de erros padro que , e a hiptese alternativa H

dista do valor de

5. Encontre o -valor usando o valor absoluto da estatstica de teste da tabela da distribuio normal (ou equivalentemente da com graus de liberdade). Uma regra geral que este teste vlido quando quando temos ambos maiores do que digamos 10. e

6.4.1 Exemplo
Referindo-se ao exemplo da Seo 5.8, suponha que algum tenha sugerido de experincias passadas que 60% das larvas de mosquito no lago deveriam ser da espcie Aedes detritus. Foram encontrados 60 desse tipo de uma amostra de 80. Os dados suportam esta hipteste?

6.5 Decises e poder


Ao tomar uma deciso a favor ou contra uma hiptese existem dois tipos de erros que voc pode cometer. Voc pode rejeitar a hiptese nula quando de fato ela verdadeira (erro tipo I) ou voc pode falhar em rejeitar H quando de fato ela falsa (erro tipo II). Existe um balano entre esses dois tipos de erros, no sentido de que ao tentar-se minizar a possibilidade de um tipo, aumenta-se a probabilidade do outro. Frequentemente denotamos as probabilidades destes dois erros como e respectivamente.

O poder de um teste a probabilidade de rejeitar a hiptese nula quando esta de fato falsa. Isto igual a . Em geral, quanto maior o tamanho da amostra, maior o poder do teste. desejvel decidir sobre um tamanho de amostra conveniente antes de conduzir um estudo de forma que o resultados do teste de hiptese ter poder suficiente para responder a questo cientfica de interesse.

6.6 Dimensionamento de amostras


Vimos no Captulo 5 e nas sees anteriores deste captulo como construir intervalos e testes de hipteses para os principais parmetros populacionais. Em todos os, supusemos dado o nvel de confiana desses intervalos e testes. Evidentemente, o nvel de confiana deve ser fixado de acordo com a probabilidade de acerto que se deseja ter na estimao por intervalo e testes. Sendo conveniente, o nvel de confiana pode ser aumentado at to prximo de 100% quanto se queira, mas isso resultar em intervalos

de amplitude cada vez maiores (e testes com poderes cada vez menores), o que significa perda de preciso na estimao. claro que seria desejvel termos intervalos com alto nvel de confiana e pequena probabilidade de erro e grande preciso. Isso porm requer uma amostra suficientemente grande, pois, para fixo, confiana e preciso variam em sentidos opostos. Veremos a seguir como determinar o tamanho das amostras necessrias nos casos de estimao da mdia ou de uma proporo populacional. Vimos na Seo 5.4 que o intervalo de confiana de 95% para a mdia semi-amplitude dada pela expresso da populao quando conhecido tem

onde

para uma confiana de 95%. Ora, o problema ento resolvido foi,

fixados o nvel de confiana ( ) e , determinar . Mas, evidente dessa expresso que podemos resolver outro problema. Fixados, e o nvel de confiana, determinar , que o problema da determinao do tamanho de amostra necessrio para se realizar a estimao por intervalo com a confiana e a preciso desejadas. Vemos imediatamente que

Essa ser a expresso usada se

for conhecido.

No conhecendo o desvio-padro da populao, deveramos subtitu-lo por sua estimativa e usar de Student na expresso acima. Ocorre porm que no tendo ainda sido retirada a amostra, no dispomos em geral do valor de . Se no conhecemos nem ao menos um limite superior para , a nica soluo ser colher uma amostra-piloto de elementos para, com base nela obtermos uma estimativa de a expresso , empregando a seguir

Se , a amostra-piloto j ter sido suficiente para a estimao. Caso contrrio, deveremos retirar, ainda, da populao os elementos necessrios complementao do tamanho mnimo de amostra. Procedemos de forma anloga se desejamos estimar uma proporo populacional com determinada confiana e dada preciso. No caso de populao suposta infinita, da expresso

podemos obter

O obstculo determinao do tamanho de amostra por meio da expresso acima est em desconhecermos . Essa dificuldade pode ser resolvida atravs de uma amostra, ou analisando-se o

piloto, analogamente ao caso descrito para a estimao de comportamento do fator para

. V-se da figura a seguir que .

a expresso de uma parbola cujo ponto de mximo

Se substituirmos,

por seu valor mximo, 1/4, seguramente o tamanho de . Isso equivale a

amostra obtido ser suficiente para a estimao de qualquer que seja considerar

Evidentemente, usando-se essa expresso corre-se o risco de se superdimensionar a amostra. Isso ocorrer se for na realidade prximo de 0 ou 1. Se o custo envolvido for

elevado e proporcional ao tamanho de amostra, mais prudente a tomada de uma amostra-piloto.

6.6.1 Exemplos
1. Qual o tamanho de amostra necessrio para se estimar a mdia de uma populao infinita cujo desvio-padro igual a 4, com 98% de confiana e preciso de 0,5? 2. Qual o tamanho de amostra suficiente para estimarmos a proporo da rea com solo contaminado que precisa de tratamento, com preciso de 0,02 e 95% de confiana, sabendo que essa proporo seguramente no superior a 0,2?

6.7 Exerccios 5
1. Exerccios 3, item 2. Teste a hiptese nula de que essa amostra provm de um corpo arenoso cuja mdia . 2. A fim de testar a ocorrncia de estratificao gradacional num certo arenito, amostras foram coletadas na base e no topo de 7 estratos desse arenito. Aplicando-se o teste-t verificar se as diferenas entre o tamanho mdio das partculas da base e do topo so significativas ou no.

3. Foram feitas vinte medidas do tempo total gasto para a precipitao de um sal, em segundos, num dado experimento, obtendo-se:

Esses dados so suficientes, pergunta-se, para estimar o tempo mdio gasto na precipitao com preciso de meio segundo e 95% de confiana? Caso negativo, qual o tamanho da amostra adicional necessria? 4. Deseja-se estimar a resitncia mdia de certo tipo de pea com preciso de 2kg e 95% de confiana. Desconhecendo-se a variabilidade dessa resistncia, roperamse cinco peas, obtendo-se para elas os seguintes valores de sua resitncia (em kg): 50,58,52,49,55. Com base no resultado obtido, determinou-se que deveriam

ser rompidas mais quinze peas, a fim de se conseguir o resultado desejado. Qual sua opinio a respeito dessa concluso? 5. Exerccios 4, item 1. Realize um teste estatstico para ajud-lo na deciso se voc deve ou no acreditar que a moeda balanceada. Qual a sua concluso? 6. Suponha que estejamos interessados em estimar a proporo de todos os motoristas que excedem o limite mximo de velocidade num trecho da rodovia entre Curitiba-So Paulo. Quo grande deve ser a amostra para que estejamos pelo menos 99% confiantes de que o erro de nossa estimativa, a proporo amostral, seja no mximo 0,04? 7. Refaa o exerccio anterior, sabendo que temos boas razes para acreditar que a proporo que estamos tentando estimar no mnimo 0,65.