Escolar Documentos
Profissional Documentos
Cultura Documentos
Introdução
Hipóteses Estatísticas
Teste de hipótese
Introdução
É uma metodologia estatística que nos auxilia a tomar decisões sobre uma ou mais populações
baseado na informação obtida da amostra.
Nos permite veri car se os dados amostrais trazem evidência que apoiem ou não uma hipótese
estatística formulada.
Essas suposições, que podem ser ou não verdadeiras, são denominadas de Hipóteses
Estatísticas.
Exemplos:
Um dos primeiros trabalhos sobre testes foi publicado em 1710 (John Arbuthnot
(https://en.wikipedia.org/wiki/John_Arbuthnot));
A ideia de testar hipóteses foi posteriormente codi cada e elaborada por R. A Fischer
(https://pt.wikipedia.org/wiki/Ronald_Fisher) (1925), que considerou os dados como um vetor
de variáveis aleatórias que pertenciam a uma distribuição de probabilidade…
Uma outra abordagem (competitiva a de Fischer) foi estabelecida por J. Neyman e Egon
Pearson (https://en.wikipedia.org/wiki/Neyman%E2%80%93Pearson_lemma) (1928)…
Hipóteses Estatísticas
Teste de hipótese
O teste de hipóteses fornecem ferramentas que nos permitem rejeitar ou não rejeitar uma
hipótese estatística através da evidencia fornecida pela amostra.
Exemplo 1
proporção de p
^ = 0.12 a partir da amostra.
É razoável que esta evidência não refuta a condição de que a proporção populacional é
p = 0.10 ou seja não rejeitamos a hipótese postulada anteriormente.
H 0 : p = 10
H 1 : p ≠ 10
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 2/26
15/10/2020 Teste de Hipóteses
A hipótese alternativa H 1 ainda pode especi car, < ou > além da diferença ≠ .
Exemplo 2
H 0 : μ = 60
H 1 : μ ≠ 60
Mais uma vez a hipótese alternativa H 1 ainda pode especi car, < ou > além da diferença ≠ .
Dessa forma a obtenção das evidências ou informação será a partir de uma amostra, e quanto
maiores as evidências (entende-se por amostra) mais fácil será a tomadad de decisão.
H 0 : μ = 60
H 1 : μ ≠ 60
Para isso tomaremos uma amostra (tamanho n ) onde será avaliada a taxa média de queima
dessa amostra (¯¯
x). Lembre-se que a média amostral é uma estimativa da média populacional.
¯
poderíamos supor que μ ≠ 60 é válida, H 1 . Assim neste caso a média amostral é a estatística
do teste.
Sabemos que a média amostral pode assumir muitos valores distintos, sendo assim podemos
supor critérios para se rejeitar ou não rejeitar a hipótese nula, do tipo, se a média estiver entre
58.5 ≤ x ≤ 61.5 não rejeitamos a H 0 , porém se a média for mais extrema que isso
¯¯
¯
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 3/26
15/10/2020 Teste de Hipóteses
Tipos de Erros
Na tomada de decisão conforme estabelcido acima, dado algum critério, podemos obviamente
estar comentendo algum erro. Chamaremos esses erros de erro do tipo I e II.
Erros do tipo I
Erros do tipo II
Erro do Tipo II: Não Rejeitar a hipótese nula H 0 quando ela é falsa
ã
β = P(erro do tipo I I ) = P(n o rejeitar H 0 |H 0 f alsa)
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 4/26
15/10/2020 Teste de Hipóteses
1 − β = P(rejeitar H 0 |H 1 verdadeira)
Code
Para testar a hipótese de que o treinamento A faz com que a performance dos atletas seja
inferior daqueles que realizaram o treinamento B testaremos as seguintes hipóteses:
Ho : de que não existe diferença na performance média dos atletas treinados com o A ou B.
H1 : de que a performance média dos atletas treinados com o A é inferior ao de B.
Cabe notar que a hipótese alternativa poderia ser de que a performance média dos atletas
treinados com o A é superior ou ainda diferente…
Ho : μA = μB
H1 : μA < μB
Ou seja vamos testar a hipótese nula frente a hipótese alternativa. De certa forma
veri caremos o quão inferior é o parâmetro do treinamento de A, e se é possível que essa
diferença tenha vindo da hipótese alternativa.
O procedimento para se testar as hipóteses é coletar uma amostra de cada população treinada
com cada uma das técnicas e veri car se as estimativas dos parâmetros são estatisticamente
diferentes. Ou melhor, a diferença entre as estimativas é muito grande a ponto de não ser
considerada ter vindo da hipótese nula, aquela que diz que ambos os treinamentos são iguais?
Quando dizemos que faremos o teste a partir de estimativas é por que não temos acesso à
população, consequentemente desconhecemos os parâmetros populacionais. Caso
conhecêssemos não precisaríamos realizar o teste, e sim somente veri car os parâmetros
populacionais.
Code
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 6/26
15/10/2020 Teste de Hipóteses
Agora tomaremos a nossa amostra de cada uma das populações, treinamento A e B, ambas com
parâmetros desconhecidos (μ A , μ B , σA
2
e σB
2
). Para o presente caso tomaremos uma amostra
aleatória de tamanho n = 15 para cada treinamento. Uma vez com as amostras calcularemos
as estatísticas amostrais (estimadores de parâmetros) e testaremos a hipótese nula para a
diferença das médias.
Code
¯¯
¯
xA = 11.8751483
¯¯
¯
xB = 13.2034837
S
2
A
= 7.3349517
S
2
B
= 8.3419714
SA = 2.7083116
SB = 2.8882471
Para este caso faremos um Teste-T (t-student), pois não conhecemos as variâncias
populacionais (σA2
, σ ), dessa forma calculamos uma estimativa da mesma (S , S ), sendo
2
B
2
A
2
B
essas variáveis aleatórias com uma distribuição aproximada pela χ2n−1 . Considerando que
σ
2
A
= σ
2
B
= σ
2
, utilizaremos ambas as informações para calcular uma estimativa única de σ 2
que chamaremos de Sp2 (essa abordagem é explicada nos exemplos que seguem na próxima
seção).
(xA − xB ) − (μ A − μ B )
T =
−−−−−−−
1 1
Sp √ +
nA nA
Code
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 7/26
15/10/2020 Teste de Hipóteses
[1] -1.299341
Code
Code
$test.statistic
[1] -1.299341
$df
[1] 28
$p.value
[1] 0.1022122
Para testar se de fato as variâncias são iguais ou não recorremos ao teste F, também como
conhecido como razão de variâncias (pois nunca tomamos a diferença dessas quantidades).
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 8/26
15/10/2020 Teste de Hipóteses
Dessa forma nosso primeiro passo será determinar se as variâncias são iguais ou não.
A variância amostral (ou seja a variável aleatória variância amostral) possui uma distribuição de
densidade de probabilidade, que é aproximadamente uma qui-quadrado χ2 , ou seja a variável
aleatória variância amostral (S 2 ) possui uma distribuição qui-quadrado.
Um vez que pretendemos testar a razão de duas variáveis aleatórias (variâncias amostrais) que
se distribuiem dessa forma aproximada a (χ2n−1 ), qual será a distribuição dessa nova variável
aleatória?
Temos que essa razão de variâncias é nada mais é do que uma função de variáveis aleatórias.
Existe uma distribuição, desenvolvida por Ronald A. Fischer, distribuição F, que é uma função
de duas variáveis aleatórias, ou seja a variável aleatória F é dada por:
Q1 /gl1
F =
Q2 /gl2
2
Q1 ∼ χ
n1 −1
2
Q2 ∼ χ
n2 −1
George W. Snedecor em seu livro Statisical Methods (1937) descreveu o teste de razão de
variâncias, chamando de Teste-F em homenagem a Ronald A. Fischer.
nA −1 2
( )S /n A − 1
σ
2 A
A
F =
nB −1 2
( )S /n B − 1
σ
2 B
B
2 2
S σ
A B
F = ∼ Fgl
A ,gl B
2 2
S σ
B A
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 9/26
15/10/2020 Teste de Hipóteses
Abaixo segue uma simulação do resultado da razão de duas distribuições χ2n−1 e uma
veri cação da distribuição aproximada dessa variável aleatória, para ns didáticos. Ainda, o
teste de Kolmogorov-Smirnov foi aplicado para veri car a adequação desses dados (F ) à uma
distribuição F. O resultado da estatística do teste foi D = 0.00061 , indicando que não pode
ser rejeitado que esses dados vieram de uma distribuição F com os respectivos graus de
liberdade.
Code
Note que a simulação não foi apresentada aqui, porém o codigo se encontra abaixo.
Code
Para se veri car se as variâncias são iguais ou não é necessário recorrer ao teste F (inferência
para duas variâncias de populações normais).
2 2
H0 : σ = σ
A A
2 2
H1 : σ ≠ σ
A A
ou seja, a hipótese nula frente à uma hipótese alternativa, que pode ser, da diferença, ou seja a
razão de variâncias ser diferente de 1, ou superior ou inferior à unidade,
2 2
H0 : σ = σ
A A
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 10/26
15/10/2020 Teste de Hipóteses
2 2
H1 : σ ≠ σ
A A
2 2
H1 : σ > σ
A A
2 2
H1 : σ < σ
A A
2
σ
A
H1 : ≠ 1
2
σ
A
2
σ
A
H1 : > 1
2
σ
A
2
σ
A
H1 : < 1
2
σ
A
2
S
A
F =
2
S
B
2
σ
A
H1 : > 1
2
σ
B
2
σ
A
H1 : < 1
2
σ
B
Voltando ao caso das amostras recolhidas A e B, testaremos a hipótese que as variâncias são
diferentes entre si.
S
2
A
= 7.3349517
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 11/26
15/10/2020 Teste de Hipóteses
S
2
B
= 8.3419714
Hipóteses
2
σ
Parâmetro de interesse a ser testado: Se σA , consequentemente
2 2 A
≠ σ = 1
B σ
2
B
2
σ
Hipótese nula: H 0
A
: = 1
2
σ
B
2
σ
Hipótese alternativa: H 1
A
: ≠ 1
2
σ
B
Estatística do teste:
Note que por simplicidade no uso das probabilidades da F tabelada opta-se por obter o maior
valor de F calculado, neste caso utilizando no numerador a maior variância amostral da
comparação.
2
S
A
F =
2
S
B
Cálculos:
2
S 8.3419
A
F = = = 1.1372
2
S 7.3349
B
Code
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 12/26
15/10/2020 Teste de Hipóteses
$test.statistic
[1] 1.137289
$df.num
[1] 14
$df.den
[1] 14
$p.value
[1] 0.8131681
Interpretação
Note que o V alor − P obtido foi de aproximadamente 0.8131681 (área hachurada), teste
bilateral, devido a H 1 ser postulada como a diferença. O V alor − P indica a probabilidade de
comentermos o Erro do Tipo I com base na amostra, ou seja, rejeitarmos a H 0 sendo ela
verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de decisão é
demasiado elevado, superior ao valor arbitrário α = 0.05 . Podemos dizer que não temos
evidência nos dados que demonstrem diferença signi cativa entre as variâncias das amostras
de preparações A e B.
desconhecidas
Voltando ao teste de médias …
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 13/26
15/10/2020 Teste de Hipóteses
Vamos considerar agora o teste de hipóteses para a diferença de duas médias populacionais, de
populações normais com suas variâncias (σA2
, σ ) desconhecidas. Para esses casos trocamos
2
B
Para tal situação poderiamos ter os seguintes casos: onde as variâncias são iguais, σA
2
= σ
2
B
,e
onde são diferentes σA
2
≠ σ
2
B
.
Para se veri car se as variâncias são iguais ou não é necessário recorrer ao teste F (inferência
para duas variâncias de populações normais).
Dessa forma suponha que tenhamos duas populações normais independentes com médias
desconhecidas e variâncias desconhecidas porém iguais, e desejamos testar as seguintes
hipóteses:
H0 : μA − μB = Δ0
H1 : μA − μB ≠ Δ0
ou seja, a hipótese nula frente à uma hipótese alteranativa, que pode ser, da diferença entre as
médias, ou da superioridade ou inferioridade de uma das médias,
H0 : μA − μB = 0
H1 : μA − μB ≠ 0
H1 : μA − μB > 0
H1 : μA − μB < 0
¯
¯¯¯ ¯
¯¯¯
Sabemos que a variância da diferença entre as variáveis aleatórias X A − XB é dada por:
2 2
σ σ
¯
¯¯¯ ¯
¯¯¯ B
V (X A − X B ) = +
nA nB
2 2
σ σ 1 1
¯
¯¯¯ ¯
¯¯¯ B 2
V (X A − X B ) = + = σ ( + )
nA nB nA nB
estimador combinado das duas variâncias estimadas é também chamado de pooled estimator,
S p , e é dado por:
2
nA − 1 nB − 1
2 2 2
Sp = ⋅ S + ⋅ S
A B
nA + nB − 2 nA + nB − 2
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 14/26
15/10/2020 Teste de Hipóteses
Note que o estimador combinado nada mais é do que uma média das variâncias ponderada
pelos tamanhos das amostras.
Assim a grandeza,
¯
¯¯¯ ¯
¯¯¯
X A − X B − (μ A − μ B )
t =
−−−−−−−
1 1
Sp √ +
nA nB
Hipótese nula: hipótese de nulidade, onde não há diferença entre as médias, as médias seriam
iguais.
H0 : μA − μB = Δ0
¯
¯¯¯ ¯
¯¯¯
X A − X B − Δ0
t0 =
−−−−−−−
1 1
Sp √ +
nA nB
H1 : μA − μB ≠ Δ0
H1 : μA − μB < Δ0
H1 : μA − μB > Δ0
Ensaios aplicados à amostra a duas preparações de concreto tem como objetivo veri car se
existe diferença signi cativa na resistência entre os dois preparos. Para isso foram obtidas e
testadas amostras de ambos os casos.
Tem se interesse em testar a hipótese de que existe diferença entre a resistência mecânica
do preparo do A frente ao preparo B. Foram retiradas 15 amostras do preparo A e 10
amostras do preparo B. Os resultados obtidos a partir das amostras são apresentados na
tabela abaixo.
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 15/26
15/10/2020 Teste de Hipóteses
Hipóteses
Hipótese nula: H 0 : μ A − μ B = 0
Hipótese alternativa: H 1 : μ A − μ B ≠ 0
Estatística do teste:
¯
¯¯¯ ¯
¯¯¯
XA − XB − 0
t0 =
−−−−−−−
1 1
Sp √ +
nA nB
¯
¯¯¯ ¯
¯¯¯
XA − XB
t0 =
−−−−−−−
1 1
Sp √ +
nA nB
¯¯
¯ ¯¯
¯
xA − xB
t0 =
−−−−−−−
1 1
sp √ +
nA nB
Cálculos:
15 − 1 10 − 1
2 2 2
sp = ⋅ 4.1 + ⋅ 3.8
15 + 10 − 2 15 + 10 − 2
2 2 2
sp = (0.6087) ⋅ 4.1 + (0.3913) ⋅ 3.8 = 15.8826
sp = 3.9853
Code
[1] 3.985299
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 16/26
15/10/2020 Teste de Hipóteses
¯¯
¯
xA − ¯¯
¯
xB
t0 =
−− −−−−−
1 1
sp √ +
nA nB
28 − 26
t0 =
−−−−−−
1 1
3.9853√ +
15 10
t0 = 1.23
Code
[1] 1.229262
Code
$test.statistic
[1] 1.229263
$df
[1] 23
$p.value
[1] 0.2314014
Interpretação
H0 sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de
decisão é demasiado elevado, V alor − P = 0.231, superior ao valor de α = 0.05 . Podemos
dizer que não temos evidência nos dados que demonstrem diferença signi cativa entre as
preparações A e B.
Suponha agora que temos o interesse em veri car a hipótese de que a adição de um
determinado aditivo em um dos preparados implica no aumento da sua resistência
mecânica. Sendo assim o tratamento foi adicionar tal aditivio ao preparo A e testar frente
ao preparo B, sem aditivo. Para o referido teste foram retiradas 17 amostras do preparo A
e 17 amostras do preparo B. Os resultados obtidos a partir das amostras são apresentados
na tabela abaixo.
Hipóteses
Hipótese nula: H 0 : μ A − μ B = 0
Hipótese alternativa: H 1 : μ A − μ B > 0
Estatística do teste:
¯¯
¯ ¯¯
¯
xA − xB
t0 =
−−−−−−−
1 1
sp √ +
nA nB
Cálculos:
17 − 1 17 − 1
2 2 2
sp = ⋅ 3.7 + ⋅ 3.8
17 + 17 − 2 17 + 17 − 2
2 2 2
sp = (0.5) ⋅ 3.7 + (0.5) ⋅ 3.8 = 14.065
sp = 3.75
Code
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 18/26
15/10/2020 Teste de Hipóteses
[1] 3.750333
¯¯
¯
xA − ¯¯
¯
xB
t0 =
−− −−−−−
1 1
sp √ +
nA nB
29 − 26
t0 =
−−−−−−
1 1
3.75√ +
17 17
t0 = 2.33
Code
[1] 2.332381
Code
$test.statistic
[1] 2.332173
$df
[1] 32
$p.value
[1] 0.01307213
Interpretação
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 19/26
15/10/2020 Teste de Hipóteses
Note que o V alor − P obtido foi de aproximadamente V alor − P = 0.0131 , onde temos
um teste unilateral, devido a H 1 ser postulada como a a superioridade de uma das médias. O
V alor − P indica a probabilidade de comentermos o Erro do Tipo I, ou seja, rejeitarmos a H 0
sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de
decisão é inferior ao valor de α = 0.05 , V alor − P = 0.0131 . Podemos dizer que temos
evidência nos dados que demonstrem um diferença estatísticamente signi cativa entre as
preparações A e B. Em outras palavras o erro que estaria sendo cometido ao rejeitarmos H 0 é
algo em torno de 1.3 %.
Para se veri car se as variâncias são iguais ou não é necessário recorrer ao teste F (inferência
para duas variâncias de populações normais).
Dessa forma suponha que tenhamos duas populações normais independentes com médias
desconhecidas e variâncias desconhecidas porém diferentes, e desejamos testar as hipóteses
H 0 versus uma H 1 .
¯
¯¯¯ ¯
¯¯¯
Sabemos que a variância da diferença entre as variáveis aleatórias X A − XB é dada por:
2 2
σ σ
¯
¯¯¯ ¯
¯¯¯ B
V (X A − X B ) = +
nA nB
Assim a grandeza,
¯
¯¯¯ ¯
¯¯¯
X A − X B − (μ A − μ B )
t =
−−−−−−−
2 2
SA SB
√ +
nA nB
possui uma distribuição t com v graus de liberadade. Para esse caso os graus de liberdade não
serão mais n A + n B − 2 e sim, calculados pela seguinte expressão:
2 2 2
SA SB
( + )
nA nB
v =
2
2 2
S 2
A S
( ) B
n
A
( )
n
B
+
nA −1 nB −1
Hipótese nula: hipótese de nulidade, onde não há diferença entre as médias, as médias seriam
iguais.
H0 : μA − μB = Δ0
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 20/26
15/10/2020 Teste de Hipóteses
¯
¯¯¯ ¯
¯¯¯
X A − X B − Δ0
t0 =
−−−−−−−
2 2
SA SB
√ +
nA nB
H1 : μA − μB ≠ Δ0
H1 : μA − μB < Δ0
H1 : μA − μB > Δ0
Seria a maior velocidade média conduzida por estudantes universitários do sexo masculino
diferente da maior velocidade média conduzida por estudantes universitários do sexo
feminino?
Existe evidência su ciente no nível α = 0.05 para concluir que a maior velocidade média
conduzida por estudantes universitários do sexo masculino difere da maior velocidade
média de estudantes universitários do sexo feminino?
Hipóteses
Hipótese nula: H 0 : μ A − μ B = 0
Hipótese alternativa: H 1 : μ A − μ B ≠ 0
Estatística do teste:
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 21/26
15/10/2020 Teste de Hipóteses
¯¯
¯
xA − ¯¯
¯
xB
t0 =
−−−−−−−
2 2
SA SB
√ +
nA nB
Cálculos:
2 2
2
20.1 12.2
( + )
34 29
v = = 55.5 = 55
2 2
20.1 2
12.2
( ) ( )
34 29
+
34−1 29−1
105.5 − 90.9
t0 =
−−−
2
−−−−−−
2
20.1 12.2
√ +
34 29
t0 = 3.54
Code
[1] 3.539453
Code
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 22/26
15/10/2020 Teste de Hipóteses
$test.statistic
[1] 3.539453
$df
[1] 55
$p.value
[1] 0.0008242127
Interpretação
Esse valor crítico pode ser obtido na tabela da distribuição t para α/2 = 0.05/2 = 0.025 pois
é um teste bilateral, na curva com graus de liberadade igual a 55.
sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de
decisão é bastante pequeno, V alor − P = 0.000824, inferior ao valor de α = 0.05 . Podemos
dizer que temos evidência nos dados que demonstram diferença signi cativa entre as
velocidades médias do grupo A e B.
(https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR)
Este conteúdo está disponível por meio da Licença Creative Commons 4.0
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 23/26
15/10/2020 Teste de Hipóteses
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 24/26
15/10/2020 Teste de Hipóteses
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 25/26
15/10/2020 Teste de Hipóteses
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 26/26