Você está na página 1de 8

ESTRUTURA DOS TESTES DE HIPÓTESES (TH)

O objetivo dos testes de hipóteses é verificar se são verdadeiras as


afirmações sobre os parâmetros de uma população e, esta verificação é realizada com
base nas informações das amostras.
Na realização de um teste de hipótese, o primeiro a fazer é definir as
hipóteses a serem testadas e, estudaremos os tipos de erros que podemos cometer ao
aceitarmos ou rejeitarmos estas hipóteses.
Chamamos de hipótese nula (H0) a hipótese que será testada que é, em
geral, uma hipótese de igualdade concordante com a afirmação feita com respeito ao
parâmetro de interesse na população;
Hipótese alternativa (H1 ou Ha) a hipótese que aceitaremos caso a
hipótese nula seja rejeitada. A hipótese alternativa pode ser unilateral (a direita ou
esquerda), bilateral ou de igualdade também.
Neste último caso, onde as duas hipóteses nula e alternativa são de
igualdade denominamos hipóteses simples. Quando a hipótese nula é de igualdade e a
alternativa de desigualdade unilateral (a direita ou a esquerda) ou bilateral denomina-se
de hipóteses compostas.

Tipos de erros em testes de hipóteses.


Aceitar H0 Rejeitar H0
H0 é verdadeira Decisão correta Erro tipo I  α
H0 é falsa Erro tipo II  β(μ ) Decisão correta
( 1 − β poder do teste)

É importante, ao testar hipóteses, controlar o erro tipo I. O erro tipo II


é também importante, mas mais difícil de ser obtido, pois depende de  , ou seja, o erro
tipo II () é encontrado sob a distribuição da hipótese alternativa. Aumentar o tamanho
da amostra (n) é a forma de diminuirmos os dois tipos de erros simultaneamente.

►A probabilidade de cometer o erro tipo I é  (alfa), é a probabilidade de rejeitar a


hipótese nula quando ela é verdadeira.
 = P(erro tipo I) = P(rejeitar H0 \ H0 verdadeira);
►A probabilidade de cometer o erro tipo II é  (beta), esta probabilidade depende do
tamanho da amostra e do verdadeiro valor do parâmetro. Esta é a probabilidade de aceitar
uma hipótese nula falsa.
() = P(erro tipo II) = P(não rejeitar H0 \ H0 falsa);

►A potência de um teste estatístico é a probabilidade de rejeitar a hipótese nula H0,


quando a hipótese alternativa for verdadeira, ou seja, rejeitar uma hipótese nula falsa. Ë
calculada como 1-  e é interpretada como a probabilidade de rejeitar corretamente uma
hipótese nula falsa.

1 −  = PODER DO TESTE = P(rejeitar H0 \ H0 falsa)

Profa. Dra. Vanderli Marino Melem AULA DIA 01 03 2023 1


3.2.1 QUATRO PARTES QUE COMPÕEM UM TESTE DE HIPÓTESES

1º CONSTRUIR AS HIPÓTESES DO TESTE


Na realização de um teste de hipótese, o primeiro a fazer é definir as hipóteses a
serem testadas: a hipótese nula (H0) e a hipótese alternativa (H1 ou Ha).
Não se esqueça de que as hipóteses se referem ao parâmetro populacional. Nunca
coloque valores amostrais nas hipóteses.

2º ENCONTRAR A ESTATÍSTICA DO TESTE


A estatística do teste é calculada com as informações da amostra e considerando
a hipótese nula.

3º DEFINIR O CRITÉRIO DE DECISÃO


1ª Opção → analisar o teste comparando a estatística do teste com o(s) valor(es) crítico(s)
tabelado(s), este(s) valor(es) crítico(s) delimita(m) uma região crítica correspondente ao
nível α de significância, em geral α=5% (0,05). Estando a estatística do teste nesta região
crítica, rejeite a hipótese nula.
Não esqueça de que esta região crítica pode ser unilateral ou bilateral, a depender
da hipótese alternativa.

2ª Opção → analisar o teste encontrando o p-valor que é uma probabilidade calculada em


relação a estatística do teste. Este p-valor pode representar uma probabilidade unilateral
ou bilateral dependendo da hipótese alternativa pretendida. Rejeite a hipótese nula se o
p-valor for pequeno, em geral, menor que α=5% (0,05).
O p-valor representa a probabilidade de rejeitar a hipótese nula sendo ela
realmente verdadeira, então sendo baixo o p-valor, a probabilidade de cometer este erro
é pequena te dando mais segurança em rejeitar a hipótese nula.

4º CONCLUIR O TESTE
Na escrita da conclusão disserte sobre o que significa ter rejeitado ou não poder
rejeitar a hipótese nula em teste. Uma boa prática é sempre mencionar o tamanho da
amostra e o nível de significância utilizado (ou o p-valor) e concluir.

Exemplos fictícios de escrita de conclusão:


i) Com base nesta amostra de n=231 indivíduos e p-valor bilateral de 0,4132 não há razões
para dizer que a proporção de vacinados no município XWY não seja de 80%.

ii) Com as informações destas 95 unidades amostrais e p-valor unilateral << 0,1% a média
da variável XWY é significativamente maior que 75 ml.

Profa. Dra. Vanderli Marino Melem AULA DIA 01 03 2023 2


TH para Média de uma População com Variância Populacional Conhecida
Primeiro  Devemos construir as hipóteses a serem testadas. A
hipótese nula é sempre uma hipótese de igualdade e a hipótese alternativa pode ser
unilateral (a direita ou esquerda), bilateral ou de igualdade também.

H0 :  = 0 vs H1 :  < 0
H1 :  > 0
H1 :   0

Segundo  calcula-se a estatística do teste supondo-se que a hipótese


x − 0
nula (H0) seja verdadeira, pela fórmula z cal = , para amostras provenientes de uma

n
população normal, ou para amostras de tamanho n 30, independente da forma da
( )
população, quando a variância populacional  for conhecida.
2

Terceiro  analisar o teste comparando a estatística do teste (zcal) com


os valores tabelados de z no nível  de significância. As regiões críticas (regiões de
rejeição da hipótese nula) encontram-se marcadas nos desenhos abaixo.

UNILATERAL SUPERIOR UNILATERAL INFERIOR BILATERAL

z − z − z z
2 2

Quarto  concluir o teste com base no passo anterior.

Exercício 1: Magalhães e Lima (2004, pg. 281) O atual tempo de travessia com balsas
entre Santos e Guarujá é considerado uma variável aleatória com distribuição Normal de
média 10 minutos e desvio padrão de 3 minutos. Uma nova balsa vai entrar em operação
e desconfia-se que será mais lenta que as anteriores, isto é, haverá aumento na média
especificada no modelo acima.
a) Especifique as hipóteses em discussão.
b) Interprete os erros tipo I e tipo II no contexto do enunciado.

Profa. Dra. Vanderli Marino Melem AULA DIA 01 03 2023 3


Exercício 2: (Magalhães e Lima, 2004, pg.263) Uma associação de defesa do consumidor
desconfia que embalagens de 450 gramas de um certo tipo de biscoito estão abaixo do
peso. Para verificar tal afirmação, foram coletados ao acaso 80 pacotes em vários
supermercados, obtendo-se uma média de peso de 447 gramas. Admitindo-se que o peso
dos pacotes segue um modelo Normal com desvio padrão de 10 gramas, que conclusão
pode ser tirada?
#TH para média usando fórmulas
n=80; mu=450; dp=10; ma=447
zcalc=((ma-mu)*sqrt(n))/dp ; zcalc
pvalor=pnorm(zcalc, 0, 1) ; pvalor
#ou
#TH para média usando dados amostrais resumidos
require(asbio)
one.sample.z(null.mu=450,xbar=447,sigma=10,n=80,alternative="less")

#Ou teste z para dados amostrais resumidos


require(BSDA)
zsum.test(mean.x=447,sigma.x=10,n.x=80,alternative="less",mu=450,conf.level=0.95)

PARA CASOS EM QUE VOCÊ TEM O CONJUNTO DE DADOS (teste z)


Exemplo: para os dados de cultivar do exercício 6 suponha que seja conhecido o desvio
padrão populacional, sigma=30 e H0:µ=1091. No R podemos usar:
cultivar=c(950.69,999.57,892.31,926.31,902.75,920.39,997.15,952.74,938.60,
929.69,967.57,1013.73,993.95,907.60,936.02)
require(asbio)
one.sample.z(data =cultivar, null.mu =1091,sigma=30,alternative = "less", conf = 0.95)
#alternative= pode ser “less”, “greater” ou "two.sided"

require(BSDA)
z.test(cultivar,alternative= "two.sided",mu=1091,sigma.x=30,conf.level=0.95)

Exercício 3: No exemplo das embalagens de biscoito obtenha e interprete o p-valor!!!

Exercício 4: Em um estudo de novas fontes de alimento, afirma-se que uma libra de certo
tipo de peixe dá, em média, 2,41 onças de CPP (concentrado peixe-proteína), que pode
ser usado para enriquecer vários produtos alimentícios. Uma amostra de 30 pedaços desse
peixe acusou uma média de 2,44 onças de CPP por libra de peixe, com desvio padrão de
0,07 onças. Esses dados corroboram a afirmação no nível de 0,05 de significância?

OBS: onça → Medida de peso inglesa, equivale a 28,349g.


libra → Medida de massa, usada no sistema inglês de pesos e medidas.

Profa. Dra. Vanderli Marino Melem AULA DIA 01 03 2023 4


TH para Média de uma População com Variância Populacional
Desconhecida
O teste t assume que as observações na amostra devem ser
coletadas de forma aleatória, devem ser independentes uma das outras e ainda, devem ser
normalmente distribuídas. Os passos para a construção do teste são:

Primeiro  Definir as hipóteses.


H0 :  = 0 vs H1 :  < 0
H1 :  > 0
H1 :   0

Segundo  Quando a amostra for pequena e  2 for desconhecida,


uma suposição de normalidade na forma da distribuição em estudo deve ser imposta para
que a seguinte estatística de teste possa ser usada,
x − 0
t cal = , onde 0 é o valor da hipótese nula.
s
n

Terceiro  analisar o teste comparando a estatística do teste (tcal) com


os valores tabelados de t no nível  de significância e n-1 graus de liberdade. As regiões
críticas (regiões de rejeição da hipótese nula) encontram-se marcadas nos desenhos
abaixo.

UNILATERAL SUPERIOR UNILATERAL INFERIOR BILATERAL

t − t − t t
2 2

Quarto  Conclusão com base no passo anterior.

Exercício 5: (Magalhães e Lima, 2004, pg. 259) Deseja-se investigar se uma moléstia
que ataca o rim altera o consumo de oxigênio desse órgão. Para indivíduos sadios, admite-
se que este consumo tem distribuição Normal com média 12 cm3/min. Os valores medidos
em cinco pacientes com a moléstia foram: 14,4; 12,9; 15,0; 13,7 e 13,5. Qual a conclusão
para o nível de significância de 1%.
#TH para média com conjunto de dados.
oxig = c(14.4, 12.9, 15, 13.7, 13.5)
t.test(oxig, mu=12, alternative="two.sided" , conf.level=0.99)

Exercício 6: Ferreira D. F. (2009, pg. 253) O rendimento médio de algodão com caroço
em uma cultivar de sistema de reprodução mista (pequena taxa de autofecundação) de
algodão é 1.091 Kg/ha. Suspeitando-se que o efeito da endogamia seja forte e cause uma
redução na produtividade média de uma determinada cultivar, foi realizado um
experimento para se testar esse efeito. Para isso foram realizadas autofecundações
manuais e uma amostra de n=15 parcelas foi avaliada. Com base nos resultados obtidos,

Profa. Dra. Vanderli Marino Melem AULA DIA 01 03 2023 5


e apresentados a seguir, testar a hipótese de interesse e concluir. Também construa um
intervalo de confiança.
950,69 999,57 892,31 926,31 902,75 920,39 997,15 952,74 938,60 929,69
967,57 1013,73 993,95 907,60 936,02
cultivar=c(950.69,999.57,892.31,926.31,902.75,920.39,997.15,952.74,938.60,
929.69,967.57,1013.73,993.95,907.60,936.02)
shapiro.test(cultivar) #Para testar se tem normalidade.
t.test(cultivar, mu=1091, alternative="less" , conf.level=0.95)

require(asbio)
ci.mu.t(cultivar,conf=.95,summarized=FALSE)

Exercício 7: Callegari-Jacques (2003, pg. 66) Bau e colaboradores (2001) realizaram


estudos de genética do comportamento em uma amostra de 143 dependentes de álcool do
sexo masculino, de Porto Alegre. Uma das variáveis estudadas foi “idade de início de
problemas devidos ao álcool - IIP” (estes problemas eram relativos à saúde e ao
relacionamento com a família ou com o trabalho). Na amostra estudada, a média para a
variável IIP foi 26,5 anos e o desvio padrão 8,3. Use um intervalo de confiança de 95%
para analisar o resultado.
Supondo que a mídia tenha divulgado que esta idade média é de 35
anos, use a amostra acima para testar esta afirmação com um nível de significância de
5%.

Para casos que tenha somente o resumo, ou seja as estatísticas amostrais: 𝑥̄ = 26,5,
n=143, s=8,3 e queira testar H0:µ=35, usa-se no R:
one.sample.t(data = NULL, null.mu = 0, xbar = NULL, sd, n = NULL,
alternative = "two.sided", conf = 0.95)
require(asbio)
ci.mu.t(x,conf=.95,sd=8.3,xbar=26.5,n=143,summarized=TRUE)
one.sample.t(null.mu =35,xbar =26.5,sd=8.3,n =143,alternative ="less", conf = 0.95)
#Ou usar teste t para resumo amostral
require(BSDA)
tsum.test(mean.x=26.5,s.x=8.3,n.x=143,alternative="less",mu=35)

Exercício 8: Considerando um conjunto de dados de níveis de leitura medidos em 12


páginas selecionadas aleatoriamente do Herry Potter e a Pedra Filosofal, de J. K. Rowling.
As medidas do índice de legibilidade de Flesch-Kincaid são resumidas nestas estatísticas:
n=12, média amostral igual a 5,075, e desvio padrão de 1,168. Os professores da Escola
Distrital de West Park não usarão o livro a menos que se mostre que o índice de
legibilidade de uma página típica esteja acima de 4. Use nível de significância de 0,05
para testar a afirmativa de que a média é maior de que 4. Os professores usarão o livro?
(TRIOLA, 2005, pg319).

Profa. Dra. Vanderli Marino Melem AULA DIA 01 03 2023 6


TH para a Proporção Populacional (amostra grande).
Primeiro  Definir as hipóteses.
H0 : p = p0 vs. H1 : p < p0
H1 : p > p0
H1 : p  p0

Segundo  Estatística do teste.


p̂ − p 0
z cal = , onde p̂ = x é a proporção na amostra de determinada
p 0 (1 − p 0 ) n
n
característica.

Terceiro  Analisar o teste no nível  de significância ou utilizando


o nível descritivo (p-valor).

Idem ao terceiro passo do teste para média com variâncias conhecidas.

Quarto  Conclusão.

No caso de pequenas amostras devemos usar as probabilidades binomiais para


encontrar o p-valor no qual a conclusão se baseará. Com comando binom.test no R.

Exercício 9: (Magalhães e Lima, 2004, pg. 255) Um relatório de uma companhia afirma
que 40% de toda água obtida, através de poços artesianos no Nordeste é salobra. Há
muitas controvérsias sobre essa informação, alguns dizem que a proporção é maior, outros
que é menor. Para dirimir as dúvidas, 400 poços foram sorteados e observou-se em 120
deles, água salobra. Qual seria a conclusão, ao nível de 3%?

binom.test(x, n, p = 0.5,
alternative = c("two.sided", "less", "greater"),
conf.level = 0.95)

binom.test(120, 400, p = 0.4,alternative = "two.sided",conf.level = 0.97)


Resultados do R
> binom.test(120, 400, p = 0.4,alternative = "two.sided",conf.level = 0.97)
Exact binomial test
data: 120 and 400
number of successes = 120, number of trials = 400, p-value = 4.194e-05
alternative hypothesis: true probability of success is not equal to 0.4
97 percent confidence interval:
0.2509840 0.3525896
sample estimates:
probability of success
0.3

Profa. Dra. Vanderli Marino Melem AULA DIA 01 03 2023 7


#Ou usar
prop.test(120, 400, 0.40, alternative="two.sided", conf.level=0.97, correct = FALSE)

# prop.test(quantidade na amostra, nº elementos na amostra,


# hipótese nula, alternative="two.sided", conf.level=0.97, correct = TRUE)
#Observe que este comando faz por qui-quadrado
# correct = TRUE indica que pode usar a correção de Yates se necessário

> prop.test(120, 400, 0.40, alternative="two.sided", conf.level=0.97, correct = FALSE)


1-sample proportions test without continuity correction
data: 120 out of 400, null probability 0.4
X-squared = 16.667, df = 1, p-value = 4.456e-05
alternative hypothesis: true p is not equal to 0.4
97 percent confidence interval:
0.2528396 0.3518149
sample estimates: p 0.3

OBS: Usando correct=FALSE obtemos um valor da estatística do teste de qui-quadrado


que é exatamente igual ao valor da estatística z elevada ao quadrado. Fazendo o teste a
mão vai encontrar o valor de zcal=-4,082482905 que (-4,082482905)2=16,666666667

Exercício 10: Um levantamento efetuado no bairro São José mostrou que 25 indivíduos
adultos de um total de 80 eram tabagistas habituais. Considerando que a prevalência de
tabagismo na população adulta seja de 20%, teste a hipótese de que a prevalência de
tabagismo no bairro São José seja diferente da prevalência da população em geral, a um
nível de decisão de 5% (ARANGO, 2012, pg238).

Exercício 11: No trabalho “Pesquisa sobre parassuicídio entre jovens da cidade de


Itajubá”, apresentado na XIV Semana Médica da FMIt por Guimarães, A. L. G., os
autores relatam na discussão: “A incidência de parassuicídio entre jovens entrevistados
de 15 a 30 anos na cidade de Itajubá obteve um índice de 14,3%, enquanto na literatura
americana este índice corresponde a 12% para a mesma faixa etária.” Mais adiante,
afirmam que o valor encontrado no trabalho não é estatísticamente maior que aquele
citado na literatura, aos níveis de significância tradicionais. Sabendo que o número de
indivíduos da amostra é 280, verifique as conclusões do artigo.

Exercício 12: Em uma amostra aleatória 136 dentre 400 pessoas que tomaram uma vacina
contra gripe sentiram algum efeito colateral. Logo, a proporção de pessoas que sentiram
algum efeito colateral após tomar a vacina é de 136 400 = 0,34 que denotaremos por p̂
e chamaremos de proporção amostral (ou proporção de sucessos), p̂ = x n é um
estimador pontual da proporção populacional p. Teste a hipótese da proporção ser igual a
40%.

Profa. Dra. Vanderli Marino Melem AULA DIA 01 03 2023 8

Você também pode gostar