Teste de Hipoteses UFSC 1

15/10/2020 Teste de Hipóteses
Introdução
Hipóteses Estatísticas
Teste de hipótese
Testes de hipóteses estatísticas

Tipos de Erros
Probabiliadde de cometer um erro na tomada de decisão
Pacote em R para auxiliar na visualização do teste de hipóteses

O teste de hipóteses e a construção da estatística de teste
Exemplo - Teste de hipóteses - 1 - diferença de médias, variâncias desconhecidas e iguais
Testando a hipótese da igualdade entre as variâncias
Testando a hipótese da diferença de médias (μ A − μB ) de populações com variâncias

desconhecidas
Caso 1: Variâncias iguais σ 2A = σ
2
B
Caso 2: Variâncias diferentes σ 2A ≠ σ

2
B
Teste de Hipóteses Code
Introdução
É uma metodologia estatística que nos auxilia a tomar decisões sobre uma ou mais populações
baseado na informação obtida da amostra.
Nos permite veri car se os dados amostrais trazem evidência que apoiem ou não uma hipótese
estatística formulada.
Ao tentarmos tomar decisões, é conveniente a formulação de suposições ou de conjeturas

sobre as populações de interesse, que, em geral, consistem em considerações sobre
parâmetros (μ, σ 2 , p) das mesmas.
Essas suposições, que podem ser ou não verdadeiras, são denominadas de Hipóteses
Estatísticas.
Em muitas situações práticas o interesse do pesquisador é veri car a veracidade sobre um ou

mais parâmetros populacionais (μ, σ 2 , p) ou sobre a distribuição de uma variável aleatória.
Exemplos:
A produtividade média milho no estado (SC) é de 2500 kg/ha;

A proporção de peças defeituosas no unidade de fabricação é de 0,10;
A propaganda produz efeito positivo nas vendas;
Os métodos de ensino produzem resultados diferentes de aprendizagem
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 1/26
Um dos primeiros trabalhos sobre testes foi publicado em 1710 (John Arbuthnot
(https://en.wikipedia.org/wiki/John_Arbuthnot));
Um dos primeiros procedimentos estatísticos que chega perto de um teste, no sentido

moderno foi proposto por Karl Pearson (https://pt.wikipedia.org/wiki/Karl_Pearson) em 1900.
Esse foi o famoso teste do Qui-quadrado, utilizado para comparar uma distribuição de
frequência observada com uma distribuição teoricamente assumida.
A ideia de testar hipóteses foi posteriormente codi cada e elaborada por R. A Fischer
(https://pt.wikipedia.org/wiki/Ronald_Fisher) (1925), que considerou os dados como um vetor
de variáveis aleatórias que pertenciam a uma distribuição de probabilidade…
Uma outra abordagem (competitiva a de Fischer) foi estabelecida por J. Neyman e Egon
Pearson (https://en.wikipedia.org/wiki/Neyman%E2%80%93Pearson_lemma) (1928)…
Mais tarde, Lehmann (https://en.wikipedia.org/wiki/Erich_Leo_Lehmann) (1993) argumentou

que de fato era possível uni car as formulação, combinando as melhores características das
duas abordagens…
Hipóteses Estatísticas
Teste de hipótese
O teste de hipóteses fornecem ferramentas que nos permitem rejeitar ou não rejeitar uma
hipótese estatística através da evidencia fornecida pela amostra.
Vamos abordar o tópico com os seguintes exemplos:
Exemplo 1
Um engenheiro postula a hipótese que a fração de itens defeituosos em um certo processo é de

p = 0.10 .
O experimento é observar uma amostra aleatória do produto em questão, e suponha que

n = 100 itens foram testados e 12 deles eram defeituosos, dessa forma foi estimada uma
proporção de p
^ = 0.12 a partir da amostra.
É razoável que esta evidência não refuta a condição de que a proporção populacional é
p = 0.10 ou seja não rejeitamos a hipótese postulada anteriormente.
No entanto, não rejeitaríamos também se fosse p = 0.12 ou talvez p = 0.15 …
Podemos expressar isso formalmente em termos de um teste de hipótese estatístico como:
H 0 : p = 10
H 1 : p ≠ 10
A a rmação de que H 0 : p = 10 é chamanda de hipótese nula, e a a rmação H 1 : p ≠ 10 é

chamada de hipótese alternativa.
A hipótese alternativa H 1 ainda pode especi car, < ou > além da diferença ≠ .
Sempre estabeleceremos a hipótese nula H0 como uma a rmação de igualdade.
Exemplo 2
Poderiamos estar interessados em veri car se a taxa média de queima de um propelente é ou

não μ = 60 cm/s.
Podemos expressar isso formalmente em termos de um teste de hipótese estatístico como:
H 0 : μ = 60
H 1 : μ ≠ 60
Mais uma vez a hipótese alternativa H 1 ainda pode especi car, < ou > além da diferença ≠ .
Testes de hipóteses estatísticas

Uma vez formuladas as hipóteses gostaríamos de testa-las para que uma decisão seja tomada,
seja em favor da hipótese nula ou da hipótese alternativa. Para tanto precisamos de algumas
evidências, ou seja de informação.
Dessa forma a obtenção das evidências ou informação será a partir de uma amostra, e quanto
maiores as evidências (entende-se por amostra) mais fácil será a tomadad de decisão.
Dado o exemplo anterior vamos construir o teste de hipótese.
Vamos veri car se a taxa média de queima de um propelente é ou não μ = 60 cm/s.
H 0 : μ = 60
H 1 : μ ≠ 60
Para isso tomaremos uma amostra (tamanho n ) onde será avaliada a taxa média de queima
dessa amostra (¯¯
x). Lembre-se que a média amostral é uma estimativa da média populacional.
¯
Caso a média amostral ¯¯

x seja próxima da média populacional μ = 60 podemos supor que
¯
μ = 60 é a verdadeira média populacional (H 0 ), e caso seja um valor muito diferente desse,
poderíamos supor que μ ≠ 60 é válida, H 1 . Assim neste caso a média amostral é a estatística
do teste.
Sabemos que a média amostral pode assumir muitos valores distintos, sendo assim podemos
supor critérios para se rejeitar ou não rejeitar a hipótese nula, do tipo, se a média estiver entre
58.5 ≤ x ≤ 61.5 não rejeitamos a H 0 , porém se a média for mais extrema que isso
¯¯
¯
rejeitaremos. Chamaremos o região dos valores extremos de região crítica ou região de

rejeição.
Tipos de Erros
Na tomada de decisão conforme estabelcido acima, dado algum critério, podemos obviamente
estar comentendo algum erro. Chamaremos esses erros de erro do tipo I e II.
Erros do tipo I
Erro do Tipo I: Rejeitar a hipótese nula H 0 quando ela é verdadeira
Erros do tipo II
Erro do Tipo II: Não Rejeitar a hipótese nula H 0 quando ela é falsa
Decisão Se H0 é verdadeira Se H0 é falsa
Rejeitar H 0 Erro do Tipo I Nenhum erro
Não Rejeitar H 0 Nenhum erro Erro do Tipo II
Probabiliadde de cometer um erro na tomada

de decisão
A probabilidade de cometer um erro (na tomada de decisão) pode ser explicitado da seguinte
forma
Probabilidade do Erro do Tipo I
α = P(erro do tipo I ) = P(rejeitar H 0 |H 0 verdadeira)
A probabilidade do erro do tipo I, α é chamado de nível de signi cância, ou erro α, ou

ainda tamanho do teste.
Probabilidade do Erro do Tipo II
ã
β = P(erro do tipo I I ) = P(n o rejeitar H 0 |H 0 f alsa)
Potência ou Poder do Teste
1 − β = P(rejeitar H 0 |H 1 verdadeira)
O poder do teste ou potência é a probabilidade de rejeitar a hipótese nula H 0 , quando a

hipótese alternativa H 1 é verdadeira
Pacote em R para auxiliar na visualização do

teste de hipóteses
Um pacote em R (Plothtests (https://github.com/Zibetti/Plothtests)) está sendo desenvolvido
com o intuito de fornecer insights a respeito do teste de hipóteses, de a forma a facilitar o
entendimento do signi cado das quantidades calculadas no teste, bem como a distribuição da
estatística amostral, valores críticos para tomada de decisão e valor de probabilidade (Valor-P).
O procedimento para instalação do pacote se encontra abaixo:
Code
O teste de hipóteses e a construção da

estatística de teste
Exemplo - Teste de hipóteses - 1 - diferença de médias,

variâncias desconhecidas e iguais
Nos testes de hipóteses utilizamos os conhecimentos de estimação de parâmetros e
probabilidade na tomada de decisão a favor de uma hipótese com base nas evidências
(amostra) que lançamos mão.
Suponha a situação em que desejamos comparar dois treinamentos de atletas, o treinamento A

e o treinamento B. Ambos tipos de treinamentos foram aplicados em atletas da mesma faixa
etária e de similar performance, sendo como suposição, que qualquer melhora ou piora na
performance dos atletas pode ser atribuída ao tipo de treinamento aplicado.
Para testar a hipótese de que o treinamento A faz com que a performance dos atletas seja
inferior daqueles que realizaram o treinamento B testaremos as seguintes hipóteses:
Ho : de que não existe diferença na performance média dos atletas treinados com o A ou B.
H1 : de que a performance média dos atletas treinados com o A é inferior ao de B.
Cabe notar que a hipótese alternativa poderia ser de que a performance média dos atletas
treinados com o A é superior ou ainda diferente…
Traduzindo isso em termos de parâmetros, temos:
Ho : μA = μB
H1 : μA < μB
Ou seja vamos testar a hipótese nula frente a hipótese alternativa. De certa forma
veri caremos o quão inferior é o parâmetro do treinamento de A, e se é possível que essa
diferença tenha vindo da hipótese alternativa.
O procedimento para se testar as hipóteses é coletar uma amostra de cada população treinada
com cada uma das técnicas e veri car se as estimativas dos parâmetros são estatisticamente
diferentes. Ou melhor, a diferença entre as estimativas é muito grande a ponto de não ser
considerada ter vindo da hipótese nula, aquela que diz que ambos os treinamentos são iguais?
Quando dizemos que faremos o teste a partir de estimativas é por que não temos acesso à
população, consequentemente desconhecemos os parâmetros populacionais. Caso
conhecêssemos não precisaríamos realizar o teste, e sim somente veri car os parâmetros
populacionais.
Somente como critério pedagógico vamos apresentar as populações subjacentes (porém

assuma que não conhecemos nada a respeito dela).
Code
Agora tomaremos a nossa amostra de cada uma das populações, treinamento A e B, ambas com
parâmetros desconhecidos (μ A , μ B , σA
2
e σB
2
). Para o presente caso tomaremos uma amostra
aleatória de tamanho n = 15 para cada treinamento. Uma vez com as amostras calcularemos
as estatísticas amostrais (estimadores de parâmetros) e testaremos a hipótese nula para a
diferença das médias.
Code
¯¯
¯
xA = 11.8751483
¯¯
¯
xB = 13.2034837
S
2
A
= 7.3349517
S
2
B
= 8.3419714
SA = 2.7083116
SB = 2.8882471
Para este caso faremos um Teste-T (t-student), pois não conhecemos as variâncias
populacionais (σA2
, σ ), dessa forma calculamos uma estimativa da mesma (S , S ), sendo
2
B
2
A
2
B
essas variáveis aleatórias com uma distribuição aproximada pela χ2n−1 . Considerando que
σ
2
A
= σ
2
B
= σ
2
, utilizaremos ambas as informações para calcular uma estimativa única de σ 2
que chamaremos de Sp2 (essa abordagem é explicada nos exemplos que seguem na próxima
seção).
(xA − xB ) − (μ A − μ B )
T =
−−−−−−−
1 1
Sp √ +
nA nA
Code
[1] -1.299341
Code
Observe que a estatística diferença entre as médias ¯¯

xA − xB = −1.3283 é tranformada na
¯ ¯¯
¯
estatística t = −1.2993 na distribuição H 0 . Dessa forma podemos calcular a probabilidade de

um valor de diferença entre as médias ser igual a esse valor ou um valor mais extremo que esse
(V alor − P ).
Note que o V alor − P é 0.1022338, o que indica a probabilidade de cometermos o erro do

tipo I a partir das evidências, ou seja a nossa amostra.
Code
$test.statistic
[1] -1.299341
$df
[1] 28
$p.value
[1] 0.1022122
Para testar se de fato as variâncias são iguais ou não recorremos ao teste F, também como
conhecido como razão de variâncias (pois nunca tomamos a diferença dessas quantidades).
Testando a hipótese da igualdade entre as variâncias
Primeiramente precisariamos estimar as variâncias, a partir desse ponto precisamos saber se

as variâncias (estimadas) são iguais ou diferentes. O método para determinar o tamanho da
relação de uma variância com a outra é dada pela razão de variâncias.
Dessa forma nosso primeiro passo será determinar se as variâncias são iguais ou não.
Vamos então realizar na verdade um teste de hipóteses para a variância.
A variância amostral (ou seja a variável aleatória variância amostral) possui uma distribuição de
densidade de probabilidade, que é aproximadamente uma qui-quadrado χ2 , ou seja a variável
aleatória variância amostral (S 2 ) possui uma distribuição qui-quadrado.
Na verdade o que podemos provar

(https://www.inf.ufsc.br/~andre.zibetti/probabilidade/distribuicao_amostral_variancia.html) é
que a quantidade ( , e ainda assim desde que a variável aleatória em questão
n−1 2 2
)S ∼ χ
σ
2 n−1
tenha distribuição normal.
Um vez que pretendemos testar a razão de duas variáveis aleatórias (variâncias amostrais) que
se distribuiem dessa forma aproximada a (χ2n−1 ), qual será a distribuição dessa nova variável
aleatória?
Temos que essa razão de variâncias é nada mais é do que uma função de variáveis aleatórias.
Existe uma distribuição, desenvolvida por Ronald A. Fischer, distribuição F, que é uma função
de duas variáveis aleatórias, ou seja a variável aleatória F é dada por:
Q1 /gl1
F =
Q2 /gl2
2
Q1 ∼ χ
n1 −1
2
Q2 ∼ χ
n2 −1
Ou seja a distribuição F é a razão de duas variáveis aleatórias independentes com distribuição

de qui-quadrado divido pelos seus resectivos graus de liberdade (gl ). A distribuição possui dois
parâmetros, que são os graus de liberdade do numerador e denominador, Fgl ,gl 1 2
George W. Snedecor em seu livro Statisical Methods (1937) descreveu o teste de razão de
variâncias, chamando de Teste-F em homenagem a Ronald A. Fischer.
Utilando as quantidades amostrais ( que seguem uma distribuição de qui-quadrado

n−1 2
2
)S
σ
com n − 1 graus de liberdade temos.
nA −1 2
( )S /n A − 1
σ
2 A
A
F =
nB −1 2
( )S /n B − 1
σ
2 B
B
2 2
S σ
A B
F = ∼ Fgl
A ,gl B
2 2
S σ
B A
Sabemos, que F ∼ F(gl

A ,gl B )
é uma distribuição F (Fischer) com graus de liberdade glA do
numerador e glB do denominador, e essa distribuição é uma razão de duas variáveis aleatórias
χ
2
n−1
.
Abaixo segue uma simulação do resultado da razão de duas distribuições χ2n−1 e uma
veri cação da distribuição aproximada dessa variável aleatória, para ns didáticos. Ainda, o
teste de Kolmogorov-Smirnov foi aplicado para veri car a adequação desses dados (F ) à uma
distribuição F. O resultado da estatística do teste foi D = 0.00061 , indicando que não pode
ser rejeitado que esses dados vieram de uma distribuição F com os respectivos graus de
liberdade.
Code
Note que a simulação não foi apresentada aqui, porém o codigo se encontra abaixo.
Code
Para se veri car se as variâncias são iguais ou não é necessário recorrer ao teste F (inferência
para duas variâncias de populações normais).
2 2
H0 : σ = σ
A A
2 2
H1 : σ ≠ σ
A A
ou seja, a hipótese nula frente à uma hipótese alternativa, que pode ser, da diferença, ou seja a
razão de variâncias ser diferente de 1, ou superior ou inferior à unidade,
2 2
H0 : σ = σ
A A
sendo a hipótese alternativa uma das seguintes opções:
2 2
H1 : σ ≠ σ
A A
2 2
H1 : σ > σ
A A
2 2
H1 : σ < σ
A A
que são equivalentes às hipóteses:
2
σ
A
H1 : ≠ 1
2
σ
A
2
σ
A
H1 : > 1
2
σ
A
2
σ
A
H1 : < 1
2
σ
A
A estatística do teste é dada por:
Teste para diferença de variâncias
O teste de hipóteses para a diferença de variâncias de duas distribuições normais.
Hipótese nula: hipótese de nulidade, onde não há diferença entre as variâncias.

2
σ
A
H0 : = 1
2
σ
B
Estatística do teste: o quão a razão de variâncias se afastam da unidade
2
S
A
F =
2
S
B
Hipóteses alternativas disponíveis a testar:

2
σ
A
H1 : ≠ 1
2
σ
B
2
σ
A
H1 : > 1
2
σ
B
2
σ
A
H1 : < 1
2
σ
B
Voltando ao caso das amostras recolhidas A e B, testaremos a hipótese que as variâncias são
diferentes entre si.
S
2
A
= 7.3349517
S
2
B
= 8.3419714
Hipóteses
2
σ
Parâmetro de interesse a ser testado: Se σA , consequentemente
2 2 A
≠ σ = 1
B σ
2
B
2
σ
Hipótese nula: H 0
A
: = 1
2
σ
B
2
σ
Hipótese alternativa: H 1
A
: ≠ 1
2
σ
B
Estatística do teste:
Note que por simplicidade no uso das probabilidades da F tabelada opta-se por obter o maior
valor de F calculado, neste caso utilizando no numerador a maior variância amostral da
comparação.
2
S
A
F =
2
S
B
Decisão do teste: Rejeita-se H 0 se o V alor − P (probabilidade de cometer o erro do

Tipo I) for menor que α.
Erro do Tipo I: é a probabilidade em rejeitar a H 0 sendo ela verdadeira.
Cálculos:
2
S 8.3419
A
F = = = 1.1372
2
S 7.3349
B
Code
$test.statistic
[1] 1.137289
$df.num
[1] 14
$df.den
[1] 14
$p.value
[1] 0.8131681
Interpretação
Note que o V alor − P obtido foi de aproximadamente 0.8131681 (área hachurada), teste
bilateral, devido a H 1 ser postulada como a diferença. O V alor − P indica a probabilidade de
comentermos o Erro do Tipo I com base na amostra, ou seja, rejeitarmos a H 0 sendo ela
verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de decisão é
demasiado elevado, superior ao valor arbitrário α = 0.05 . Podemos dizer que não temos
evidência nos dados que demonstrem diferença signi cativa entre as variâncias das amostras
de preparações A e B.
Testando a hipótese da diferença de médias (

μA − μB ) de populações com variâncias
desconhecidas
Voltando ao teste de médias …
Vamos considerar agora o teste de hipóteses para a diferença de duas médias populacionais, de
populações normais com suas variâncias (σA2
, σ ) desconhecidas. Para esses casos trocamos
2
B
as variâncias populacionais por variâncias estimadas a partir das amostras (SA

2
, S ).
2
B
Para tal situação poderiamos ter os seguintes casos: onde as variâncias são iguais, σA
2
= σ
2
B
,e
onde são diferentes σA
2
≠ σ
2
B
.
Caso 1: Variâncias iguais σA

2
= σ
B
2
Dessa forma suponha que tenhamos duas populações normais independentes com médias
desconhecidas e variâncias desconhecidas porém iguais, e desejamos testar as seguintes
hipóteses:
H0 : μA − μB = Δ0
H1 : μA − μB ≠ Δ0
ou seja, a hipótese nula frente à uma hipótese alteranativa, que pode ser, da diferença entre as
médias, ou da superioridade ou inferioridade de uma das médias,
H0 : μA − μB = 0
sendo a hipótese alternativa uma das seguintes opções:
H1 : μA − μB ≠ 0
H1 : μA − μB > 0
H1 : μA − μB < 0
¯
¯¯¯ ¯
¯¯¯
Sabemos que a variância da diferença entre as variáveis aleatórias X A − XB é dada por:
2 2
σ σ
¯
¯¯¯ ¯
¯¯¯ B
V (X A − X B ) = +
nA nB
Sendo as variâncias iguais σA

2
= σ
2
B
= σ
2
, temos que:
2 2
σ σ 1 1
¯
¯¯¯ ¯
¯¯¯ B 2
V (X A − X B ) = + = σ ( + )
nA nB nA nB
Dessa forma combinar as duas estimativas (SA

2
, S ) em uma única (S ) parece razoável. O
2
B
2
estimador combinado das duas variâncias estimadas é também chamado de pooled estimator,
S p , e é dado por:
2
nA − 1 nB − 1
2 2 2
Sp = ⋅ S + ⋅ S
A B
nA + nB − 2 nA + nB − 2
Note que o estimador combinado nada mais é do que uma média das variâncias ponderada
pelos tamanhos das amostras.
Assim a grandeza,
¯
¯¯¯ ¯
¯¯¯
X A − X B − (μ A − μ B )
t =
−−−−−−−
1 1
Sp √ +
nA nB
possui uma distribuição t com n A + nB − 2 graus de liberadade.
Teste para diferença de médias, variâncias desconhecidas e iguais
O teste de hipóteses para a diferença de médias de duas distribuições normais, variâncias

desconhecidas e iguais.
Hipótese nula: hipótese de nulidade, onde não há diferença entre as médias, as médias seriam
iguais.
H0 : μA − μB = Δ0
Estatística do teste: o quão diferentes são as médias (diferença padronizada)
¯
¯¯¯ ¯
¯¯¯
X A − X B − Δ0
t0 =
−−−−−−−
1 1
Sp √ +
nA nB
H1 : μA − μB ≠ Δ0
H1 : μA − μB < Δ0
H1 : μA − μB > Δ0
Exemplo 1 - teste bilateral (≠)
Ensaios aplicados à amostra a duas preparações de concreto tem como objetivo veri car se
existe diferença signi cativa na resistência entre os dois preparos. Para isso foram obtidas e
testadas amostras de ambos os casos.
Tem se interesse em testar a hipótese de que existe diferença entre a resistência mecânica
do preparo do A frente ao preparo B. Foram retiradas 15 amostras do preparo A e 10
amostras do preparo B. Os resultados obtidos a partir das amostras são apresentados na
tabela abaixo.
Considere as variâncias iguais, e um α = 0.05 .
Preparo Média (¯x

x̄ )
¯¯
Desvio Padrão (s) Amostra (n)
Preparo A 28 Mpa 4.1 MPa 15
Preparo B 26 Mpa 3.8 MPa 10
Hipóteses
Parâmetro de interesse a ser testado: Se μ A = μB , consequentemente μ A − μB = 0
Hipótese nula: H 0 : μ A − μ B = 0
Hipótese alternativa: H 1 : μ A − μ B ≠ 0
¯
¯¯¯ ¯
¯¯¯
XA − XB − 0
t0 =
−−−−−−−
1 1
Sp √ +
nA nB
¯
¯¯¯ ¯
¯¯¯
XA − XB
t0 =
−−−−−−−
1 1
Sp √ +
nA nB
¯¯
¯ ¯¯
¯
xA − xB
t0 =
−−−−−−−
1 1
sp √ +
nA nB

Cálculos:
15 − 1 10 − 1
2 2 2
sp = ⋅ 4.1 + ⋅ 3.8
15 + 10 − 2 15 + 10 − 2
2 2 2
sp = (0.6087) ⋅ 4.1 + (0.3913) ⋅ 3.8 = 15.8826
sp = 3.9853
Code
[1] 3.985299
¯¯
¯
xA − ¯¯
¯
xB
t0 =
−− −−−−−
1 1
sp √ +
nA nB
28 − 26
t0 =
−−−−−−
1 1
3.9853√ +
15 10
t0 = 1.23
Code
[1] 1.229262
Code
$test.statistic
[1] 1.229263
$df
[1] 23
$p.value
[1] 0.2314014
Interpretação
Note que o V alor − P obtido foi de aproximadamente V alor − P = 2 ∗ 0.116 = 0.231

(área hachurada), onde temos um teste bilateral, devido a H 1 ser postulada como a diferença.
O V alor − P indica a probabilidade de comentermos o Erro do Tipo I, ou seja, rejeitarmos a
H0 sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de
decisão é demasiado elevado, V alor − P = 0.231, superior ao valor de α = 0.05 . Podemos
dizer que não temos evidência nos dados que demonstrem diferença signi cativa entre as
preparações A e B.
Exemplo 2 - teste unilateral (< ou >)
Suponha agora que temos o interesse em veri car a hipótese de que a adição de um
determinado aditivo em um dos preparados implica no aumento da sua resistência
mecânica. Sendo assim o tratamento foi adicionar tal aditivio ao preparo A e testar frente
ao preparo B, sem aditivo. Para o referido teste foram retiradas 17 amostras do preparo A
e 17 amostras do preparo B. Os resultados obtidos a partir das amostras são apresentados
na tabela abaixo.
Considere as variâncias iguais, e um α = 0.05 .
As variâncias podem ser testadas para igualdade utilizando um Teste F (Fischer).
Preparo Média (¯¯

x)
¯
Preparo com aditivo A 29 Mpa 3.7 MPa 17
Preparo sem aditivo B 26 Mpa 3.8 MPa 17
Hipóteses
Hipótese alternativa: H 1 : μ A − μ B > 0
¯¯
¯ ¯¯
¯
xA − xB
t0 =
−−−−−−−
1 1
sp √ +
nA nB
- Decisão do teste: Rejeita-se H 0 se o V alor − P (probabilidade de cometer o erro do Tipo I)

for menor que α.
Cálculos:
17 − 1 17 − 1
2 2 2
sp = ⋅ 3.7 + ⋅ 3.8
17 + 17 − 2 17 + 17 − 2
2 2 2
sp = (0.5) ⋅ 3.7 + (0.5) ⋅ 3.8 = 14.065
sp = 3.75
Code
[1] 3.750333
¯¯
¯
xA − ¯¯
¯
xB
t0 =
−− −−−−−
1 1
sp √ +
nA nB
29 − 26
t0 =
−−−−−−
1 1
3.75√ +
17 17
t0 = 2.33
Code
[1] 2.332381
Code
$test.statistic
[1] 2.332173
$df
[1] 32
$p.value
[1] 0.01307213
Interpretação
Note que o V alor − P obtido foi de aproximadamente V alor − P = 0.0131 , onde temos
um teste unilateral, devido a H 1 ser postulada como a a superioridade de uma das médias. O
V alor − P indica a probabilidade de comentermos o Erro do Tipo I, ou seja, rejeitarmos a H 0
sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de
decisão é inferior ao valor de α = 0.05 , V alor − P = 0.0131 . Podemos dizer que temos
evidência nos dados que demonstrem um diferença estatísticamente signi cativa entre as
preparações A e B. Em outras palavras o erro que estaria sendo cometido ao rejeitarmos H 0 é
algo em torno de 1.3 %.
Caso 2: Variâncias diferentes σA

2
≠ σ
B
2
Dessa forma suponha que tenhamos duas populações normais independentes com médias
desconhecidas e variâncias desconhecidas porém diferentes, e desejamos testar as hipóteses
H 0 versus uma H 1 .
¯
¯¯¯ ¯
¯¯¯
Sabemos que a variância da diferença entre as variáveis aleatórias X A − XB é dada por:
2 2
σ σ
¯
¯¯¯ ¯
¯¯¯ B
V (X A − X B ) = +
nA nB
Assim a grandeza,
¯
¯¯¯ ¯
¯¯¯
X A − X B − (μ A − μ B )
t =
−−−−−−−
2 2
SA SB
√ +
nA nB
possui uma distribuição t com v graus de liberadade. Para esse caso os graus de liberdade não
serão mais n A + n B − 2 e sim, calculados pela seguinte expressão:
2 2 2
SA SB
( + )
nA nB
v =
2
2 2
S 2
A S
( ) B
n
A
( )
n
B
+
nA −1 nB −1
Teste para diferença de médias, variâncias desconhecidas e diferentes
O teste de hipóteses para a diferença de médias de duas distribuições normais, variâncias

desconhecidas e diferentes.
Hipótese nula: hipótese de nulidade, onde não há diferença entre as médias, as médias seriam
iguais.
H0 : μA − μB = Δ0
Estatística do teste: o quão diferentes são as médias (diferença padronizada)
¯
¯¯¯ ¯
¯¯¯
X A − X B − Δ0
t0 =
−−−−−−−
2 2
SA SB
√ +
nA nB
H1 : μA − μB ≠ Δ0
H1 : μA − μB < Δ0
H1 : μA − μB > Δ0
Exemplo 3 - teste bilateral (≠)
Um psicólogo estava interessado em explorar se os estudantes universitários do sexo

masculino e feminino têm ou não diferentes comportamentos de condução. Havia uma série
de maneiras que ela poderia quanti car comportamentos de condução. Ela optou por se
concentrar na velocidade mais rápida já dirigida por um indivíduo. Portanto, a questão
estatística em particular que ele formulou foi a seguinte:
Seria a maior velocidade média conduzida por estudantes universitários do sexo masculino
diferente da maior velocidade média conduzida por estudantes universitários do sexo
feminino?
Ele realizou um levantamento de uma amostra aleatória n A = 34 estudantes universitários

do sexo masculino e n B = 29 estudantes universitários do sexo feminino.
Existe evidência su ciente no nível α = 0.05 para concluir que a maior velocidade média
conduzida por estudantes universitários do sexo masculino difere da maior velocidade
média de estudantes universitários do sexo feminino?
Considere as variâncias diferentes.
O resumo descritivo dos resultados de sua pesquisa:
Grupo Média (¯¯

x)
¯
Masculino A 105.5 20.1 34
Feminino B 90.9 12.2 29
Hipóteses
Hipótese alternativa: H 1 : μ A − μ B ≠ 0
¯¯
¯
xA − ¯¯
¯
xB
t0 =
−−−−−−−
2 2
SA SB
√ +
nA nB

Cálculos:
Suposições: Vamos assumir que as variáveis aleatórias maiores velocidades (masculino e

feminino) são normalmente distribuidas e que cada amostra é independente.
Calculando os graus de liberdade, v :
2 2
2
20.1 12.2
( + )
34 29
v = = 55.5 = 55
2 2
20.1 2
12.2
( ) ( )
34 29
+
34−1 29−1
Calculando a estatística do teste:
105.5 − 90.9
t0 =
−−−
2
−−−−−−
2
20.1 12.2
√ +
34 29
t0 = 3.54
Code
[1] 3.539453
Code
$test.statistic
[1] 3.539453
$df
[1] 55
$p.value
[1] 0.0008242127
Interpretação
O valor crítico para rejeição da hipótese nula H 0 em favor da hipótese alternativa H 1 é:
t0 > t0.025,55 = 2.004
Esse valor crítico pode ser obtido na tabela da distribuição t para α/2 = 0.05/2 = 0.025 pois
é um teste bilateral, na curva com graus de liberadade igual a 55.
Note que o V alor − P obtido foi de aproximadamente p = 2 ∗ 0.000412 = 0.000824 (área

hachurada), onde temos um teste bilateral, devido a H 1 ser postulada como a diferença. O
V alor − P indica a probabilidade de comentermos o Erro do Tipo I, ou seja, rejeitarmos a H 0
sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de
decisão é bastante pequeno, V alor − P = 0.000824, inferior ao valor de α = 0.05 . Podemos
dizer que temos evidência nos dados que demonstram diferença signi cativa entre as
velocidades médias do grupo A e B.
(https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR)
Este conteúdo está disponível por meio da Licença Creative Commons 4.0

Teste de Hipoteses UFSC 1

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teste de Hipoteses UFSC 1

Enviado por

Direitos autorais:

Formatos disponíveis

15/10/2020 Teste de Hipóteses

Testes de hipóteses estatísticas

Pacote em R para auxiliar na visualização do teste de hipóteses

Testando a hipótese da igualdade entre as variâncias

Testando a hipótese da diferença de médias (μ A − μB ) de populações com variâncias

Caso 2: Variâncias diferentes σ 2A ≠ σ

Teste de Hipóteses Code

Ao tentarmos tomar decisões, é conveniente a formulação de suposições ou de conjeturas

Em muitas situações práticas o interesse do pesquisador é veri car a veracidade sobre um ou

A produtividade média milho no estado (SC) é de 2500 kg/ha;

Um dos primeiros procedimentos estatísticos que chega perto de um teste, no sentido

Mais tarde, Lehmann (https://en.wikipedia.org/wiki/Erich_Leo_Lehmann) (1993) argumentou

Vamos abordar o tópico com os seguintes exemplos:

Um engenheiro postula a hipótese que a fração de itens defeituosos em um certo processo é de

O experimento é observar uma amostra aleatória do produto em questão, e suponha que

No entanto, não rejeitaríamos também se fosse p = 0.12 ou talvez p = 0.15 …

Podemos expressar isso formalmente em termos de um teste de hipótese estatístico como:

A a rmação de que H 0 : p = 10 é chamanda de hipótese nula, e a a rmação H 1 : p ≠ 10 é

Sempre estabeleceremos a hipótese nula H0 como uma a rmação de igualdade.

Poderiamos estar interessados em veri car se a taxa média de queima de um propelente é ou

Podemos expressar isso formalmente em termos de um teste de hipótese estatístico como:

Testes de hipóteses estatísticas

Dado o exemplo anterior vamos construir o teste de hipótese.

Vamos veri car se a taxa média de queima de um propelente é ou não μ = 60 cm/s.

Caso a média amostral ¯¯

μ = 60 é a verdadeira média populacional (H 0 ), e caso seja um valor muito diferente desse,

rejeitaremos. Chamaremos o região dos valores extremos de região crítica ou região de

Erro do Tipo I: Rejeitar a hipótese nula H 0 quando ela é verdadeira

Decisão Se H0 é verdadeira Se H0 é falsa

Rejeitar H 0 Erro do Tipo I Nenhum erro

Não Rejeitar H 0 Nenhum erro Erro do Tipo II

Probabiliadde de cometer um erro na tomada

Probabilidade do Erro do Tipo I

α = P(erro do tipo I ) = P(rejeitar H 0 |H 0 verdadeira)

A probabilidade do erro do tipo I, α é chamado de nível de signi cância, ou erro α, ou

Probabilidade do Erro do Tipo II

Potência ou Poder do Teste

O poder do teste ou potência é a probabilidade de rejeitar a hipótese nula H 0 , quando a

Pacote em R para auxiliar na visualização do

O procedimento para instalação do pacote se encontra abaixo:

O teste de hipóteses e a construção da

Exemplo - Teste de hipóteses - 1 - diferença de médias,

Suponha a situação em que desejamos comparar dois treinamentos de atletas, o treinamento A

Traduzindo isso em termos de parâmetros, temos:

Somente como critério pedagógico vamos apresentar as populações subjacentes (porém

Observe que a estatística diferença entre as médias ¯¯

estatística t = −1.2993 na distribuição H 0 . Dessa forma podemos calcular a probabilidade de

Note que o V alor − P é 0.1022338, o que indica a probabilidade de cometermos o erro do

Testando a hipótese da igualdade entre as variâncias

Primeiramente precisariamos estimar as variâncias, a partir desse ponto precisamos saber se

Vamos então realizar na verdade um teste de hipóteses para a variância.

Na verdade o que podemos provar

tenha distribuição normal.

Ou seja a distribuição F é a razão de duas variáveis aleatórias independentes com distribuição

Utilando as quantidades amostrais ( que seguem uma distribuição de qui-quadrado

com n − 1 graus de liberdade temos.

Sabemos, que F ∼ F(gl

sendo a hipótese alternativa uma das seguintes opções:

que são equivalentes às hipóteses:

A estatística do teste é dada por:

Teste para diferença de variâncias

O teste de hipóteses para a diferença de variâncias de duas distribuições normais.

Hipótese nula: hipótese de nulidade, onde não há diferença entre as variâncias.

Estatística do teste: o quão a razão de variâncias se afastam da unidade