Você está na página 1de 26

15/10/2020 Teste de Hipóteses

Introdução

Hipóteses Estatísticas
Teste de hipótese

Testes de hipóteses estatísticas


Tipos de Erros
Probabiliadde de cometer um erro na tomada de decisão

Pacote em R para auxiliar na visualização do teste de hipóteses


O teste de hipóteses e a construção da estatística de teste
Exemplo - Teste de hipóteses - 1 - diferença de médias, variâncias desconhecidas e iguais

Testando a hipótese da igualdade entre as variâncias

Testando a hipótese da diferença de médias (μ A − μB ) de populações com variâncias


desconhecidas
Caso 1: Variâncias iguais σ 2A = σ
2
B

Caso 2: Variâncias diferentes σ 2A ≠ σ


2
B

Teste de Hipóteses Code

Introdução
É uma metodologia estatística que nos auxilia a tomar decisões sobre uma ou mais populações
baseado na informação obtida da amostra.

Nos permite veri car se os dados amostrais trazem evidência que apoiem ou não uma hipótese
estatística formulada.

Ao tentarmos tomar decisões, é conveniente a formulação de suposições ou de conjeturas


sobre as populações de interesse, que, em geral, consistem em considerações sobre
parâmetros (μ, σ 2 , p) das mesmas.

Essas suposições, que podem ser ou não verdadeiras, são denominadas de Hipóteses
Estatísticas.

Em muitas situações práticas o interesse do pesquisador é veri car a veracidade sobre um ou


mais parâmetros populacionais (μ, σ 2 , p) ou sobre a distribuição de uma variável aleatória.

Exemplos:

A produtividade média milho no estado (SC) é de 2500 kg/ha;


A proporção de peças defeituosas no unidade de fabricação é de 0,10;
A propaganda produz efeito positivo nas vendas;
Os métodos de ensino produzem resultados diferentes de aprendizagem
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 1/26
15/10/2020 Teste de Hipóteses

Um dos primeiros trabalhos sobre testes foi publicado em 1710 (John Arbuthnot
(https://en.wikipedia.org/wiki/John_Arbuthnot));

Um dos primeiros procedimentos estatísticos que chega perto de um teste, no sentido


moderno foi proposto por Karl Pearson (https://pt.wikipedia.org/wiki/Karl_Pearson) em 1900.
Esse foi o famoso teste do Qui-quadrado, utilizado para comparar uma distribuição de
frequência observada com uma distribuição teoricamente assumida.

A ideia de testar hipóteses foi posteriormente codi cada e elaborada por R. A Fischer
(https://pt.wikipedia.org/wiki/Ronald_Fisher) (1925), que considerou os dados como um vetor
de variáveis aleatórias que pertenciam a uma distribuição de probabilidade…

Uma outra abordagem (competitiva a de Fischer) foi estabelecida por J. Neyman e Egon
Pearson (https://en.wikipedia.org/wiki/Neyman%E2%80%93Pearson_lemma) (1928)…

Mais tarde, Lehmann (https://en.wikipedia.org/wiki/Erich_Leo_Lehmann) (1993) argumentou


que de fato era possível uni car as formulação, combinando as melhores características das
duas abordagens…

Hipóteses Estatísticas
Teste de hipótese

O teste de hipóteses fornecem ferramentas que nos permitem rejeitar ou não rejeitar uma
hipótese estatística através da evidencia fornecida pela amostra.

Vamos abordar o tópico com os seguintes exemplos:

Exemplo 1

Um engenheiro postula a hipótese que a fração de itens defeituosos em um certo processo é de


p = 0.10 .

O experimento é observar uma amostra aleatória do produto em questão, e suponha que


n = 100 itens foram testados e 12 deles eram defeituosos, dessa forma foi estimada uma

proporção de p
^ = 0.12 a partir da amostra.

É razoável que esta evidência não refuta a condição de que a proporção populacional é
p = 0.10 ou seja não rejeitamos a hipótese postulada anteriormente.

No entanto, não rejeitaríamos também se fosse p = 0.12 ou talvez p = 0.15 …

Podemos expressar isso formalmente em termos de um teste de hipótese estatístico como:

H 0 : p = 10

H 1 : p ≠ 10

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 2/26
15/10/2020 Teste de Hipóteses

A a rmação de que H 0 : p = 10 é chamanda de hipótese nula, e a a rmação H 1 : p ≠ 10 é


chamada de hipótese alternativa.

A hipótese alternativa H 1 ainda pode especi car, < ou > além da diferença ≠ .

Sempre estabeleceremos a hipótese nula H0 como uma a rmação de igualdade.

Exemplo 2

Poderiamos estar interessados em veri car se a taxa média de queima de um propelente é ou


não μ = 60 cm/s.

Podemos expressar isso formalmente em termos de um teste de hipótese estatístico como:

H 0 : μ = 60

H 1 : μ ≠ 60

Mais uma vez a hipótese alternativa H 1 ainda pode especi car, < ou > além da diferença ≠ .

Testes de hipóteses estatísticas


Uma vez formuladas as hipóteses gostaríamos de testa-las para que uma decisão seja tomada,
seja em favor da hipótese nula ou da hipótese alternativa. Para tanto precisamos de algumas
evidências, ou seja de informação.

Dessa forma a obtenção das evidências ou informação será a partir de uma amostra, e quanto
maiores as evidências (entende-se por amostra) mais fácil será a tomadad de decisão.

Dado o exemplo anterior vamos construir o teste de hipótese.

Vamos veri car se a taxa média de queima de um propelente é ou não μ = 60 cm/s.

H 0 : μ = 60

H 1 : μ ≠ 60

Para isso tomaremos uma amostra (tamanho n ) onde será avaliada a taxa média de queima
dessa amostra (¯¯
x). Lembre-se que a média amostral é uma estimativa da média populacional.
¯

Caso a média amostral ¯¯


x seja próxima da média populacional μ = 60 podemos supor que
¯

μ = 60 é a verdadeira média populacional (H 0 ), e caso seja um valor muito diferente desse,

poderíamos supor que μ ≠ 60 é válida, H 1 . Assim neste caso a média amostral é a estatística
do teste.

Sabemos que a média amostral pode assumir muitos valores distintos, sendo assim podemos
supor critérios para se rejeitar ou não rejeitar a hipótese nula, do tipo, se a média estiver entre
58.5 ≤ x ≤ 61.5 não rejeitamos a H 0 , porém se a média for mais extrema que isso
¯¯
¯

rejeitaremos. Chamaremos o região dos valores extremos de região crítica ou região de


rejeição.

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 3/26
15/10/2020 Teste de Hipóteses

Tipos de Erros
Na tomada de decisão conforme estabelcido acima, dado algum critério, podemos obviamente
estar comentendo algum erro. Chamaremos esses erros de erro do tipo I e II.

Erros do tipo I

Erro do Tipo I: Rejeitar a hipótese nula H 0 quando ela é verdadeira

Erros do tipo II

Erro do Tipo II: Não Rejeitar a hipótese nula H 0 quando ela é falsa

Decisão Se H0 é verdadeira Se H0 é falsa

Rejeitar H 0 Erro do Tipo I Nenhum erro

Não Rejeitar H 0 Nenhum erro Erro do Tipo II

Probabiliadde de cometer um erro na tomada


de decisão
A probabilidade de cometer um erro (na tomada de decisão) pode ser explicitado da seguinte
forma

Probabilidade do Erro do Tipo I

α = P(erro do tipo I ) = P(rejeitar H 0 |H 0 verdadeira)

A probabilidade do erro do tipo I, α é chamado de nível de signi cância, ou erro α, ou


ainda tamanho do teste.

Probabilidade do Erro do Tipo II

ã
β = P(erro do tipo I I ) = P(n o rejeitar H 0 |H 0 f alsa)

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 4/26
15/10/2020 Teste de Hipóteses

Potência ou Poder do Teste

1 − β = P(rejeitar H 0 |H 1 verdadeira)

O poder do teste ou potência é a probabilidade de rejeitar a hipótese nula H 0 , quando a


hipótese alternativa H 1 é verdadeira

Pacote em R para auxiliar na visualização do


teste de hipóteses
Um pacote em R (Plothtests (https://github.com/Zibetti/Plothtests)) está sendo desenvolvido
com o intuito de fornecer insights a respeito do teste de hipóteses, de a forma a facilitar o
entendimento do signi cado das quantidades calculadas no teste, bem como a distribuição da
estatística amostral, valores críticos para tomada de decisão e valor de probabilidade (Valor-P).

O procedimento para instalação do pacote se encontra abaixo:

Code

O teste de hipóteses e a construção da


estatística de teste
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 5/26
15/10/2020 Teste de Hipóteses

Exemplo - Teste de hipóteses - 1 - diferença de médias,


variâncias desconhecidas e iguais
Nos testes de hipóteses utilizamos os conhecimentos de estimação de parâmetros e
probabilidade na tomada de decisão a favor de uma hipótese com base nas evidências
(amostra) que lançamos mão.

Suponha a situação em que desejamos comparar dois treinamentos de atletas, o treinamento A


e o treinamento B. Ambos tipos de treinamentos foram aplicados em atletas da mesma faixa
etária e de similar performance, sendo como suposição, que qualquer melhora ou piora na
performance dos atletas pode ser atribuída ao tipo de treinamento aplicado.

Para testar a hipótese de que o treinamento A faz com que a performance dos atletas seja
inferior daqueles que realizaram o treinamento B testaremos as seguintes hipóteses:

Ho : de que não existe diferença na performance média dos atletas treinados com o A ou B.
H1 : de que a performance média dos atletas treinados com o A é inferior ao de B.

Cabe notar que a hipótese alternativa poderia ser de que a performance média dos atletas
treinados com o A é superior ou ainda diferente…

Traduzindo isso em termos de parâmetros, temos:

Ho : μA = μB

H1 : μA < μB

Ou seja vamos testar a hipótese nula frente a hipótese alternativa. De certa forma
veri caremos o quão inferior é o parâmetro do treinamento de A, e se é possível que essa
diferença tenha vindo da hipótese alternativa.

O procedimento para se testar as hipóteses é coletar uma amostra de cada população treinada
com cada uma das técnicas e veri car se as estimativas dos parâmetros são estatisticamente
diferentes. Ou melhor, a diferença entre as estimativas é muito grande a ponto de não ser
considerada ter vindo da hipótese nula, aquela que diz que ambos os treinamentos são iguais?

Quando dizemos que faremos o teste a partir de estimativas é por que não temos acesso à
população, consequentemente desconhecemos os parâmetros populacionais. Caso
conhecêssemos não precisaríamos realizar o teste, e sim somente veri car os parâmetros
populacionais.

Somente como critério pedagógico vamos apresentar as populações subjacentes (porém


assuma que não conhecemos nada a respeito dela).

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 6/26
15/10/2020 Teste de Hipóteses

Agora tomaremos a nossa amostra de cada uma das populações, treinamento A e B, ambas com
parâmetros desconhecidos (μ A , μ B , σA
2
e σB
2
). Para o presente caso tomaremos uma amostra
aleatória de tamanho n = 15 para cada treinamento. Uma vez com as amostras calcularemos
as estatísticas amostrais (estimadores de parâmetros) e testaremos a hipótese nula para a
diferença das médias.

Code
¯¯
¯
xA = 11.8751483
¯¯
¯
xB = 13.2034837

S
2
A
= 7.3349517

S
2
B
= 8.3419714

SA = 2.7083116

SB = 2.8882471

Para este caso faremos um Teste-T (t-student), pois não conhecemos as variâncias
populacionais (σA2
, σ ), dessa forma calculamos uma estimativa da mesma (S , S ), sendo
2
B
2
A
2
B

essas variáveis aleatórias com uma distribuição aproximada pela χ2n−1 . Considerando que
σ
2
A
= σ
2
B
= σ
2
, utilizaremos ambas as informações para calcular uma estimativa única de σ 2
que chamaremos de Sp2 (essa abordagem é explicada nos exemplos que seguem na próxima
seção).

(xA − xB ) − (μ A − μ B )
T =
−−−−−−−
1 1
Sp √ +
nA nA

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 7/26
15/10/2020 Teste de Hipóteses

[1] -1.299341

Code

Observe que a estatística diferença entre as médias ¯¯


xA − xB = −1.3283 é tranformada na
¯ ¯¯
¯

estatística t = −1.2993 na distribuição H 0 . Dessa forma podemos calcular a probabilidade de


um valor de diferença entre as médias ser igual a esse valor ou um valor mais extremo que esse
(V alor − P ).

Note que o V alor − P é 0.1022338, o que indica a probabilidade de cometermos o erro do


tipo I a partir das evidências, ou seja a nossa amostra.

Code

$test.statistic
[1] -1.299341

$df
[1] 28

$p.value
[1] 0.1022122

Para testar se de fato as variâncias são iguais ou não recorremos ao teste F, também como
conhecido como razão de variâncias (pois nunca tomamos a diferença dessas quantidades).

Testando a hipótese da igualdade entre as variâncias

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 8/26
15/10/2020 Teste de Hipóteses

Primeiramente precisariamos estimar as variâncias, a partir desse ponto precisamos saber se


as variâncias (estimadas) são iguais ou diferentes. O método para determinar o tamanho da
relação de uma variância com a outra é dada pela razão de variâncias.

Dessa forma nosso primeiro passo será determinar se as variâncias são iguais ou não.

Vamos então realizar na verdade um teste de hipóteses para a variância.

A variância amostral (ou seja a variável aleatória variância amostral) possui uma distribuição de
densidade de probabilidade, que é aproximadamente uma qui-quadrado χ2 , ou seja a variável
aleatória variância amostral (S 2 ) possui uma distribuição qui-quadrado.

Na verdade o que podemos provar


(https://www.inf.ufsc.br/~andre.zibetti/probabilidade/distribuicao_amostral_variancia.html) é
que a quantidade ( , e ainda assim desde que a variável aleatória em questão
n−1 2 2
)S ∼ χ
σ
2 n−1

tenha distribuição normal.

Um vez que pretendemos testar a razão de duas variáveis aleatórias (variâncias amostrais) que
se distribuiem dessa forma aproximada a (χ2n−1 ), qual será a distribuição dessa nova variável
aleatória?

Temos que essa razão de variâncias é nada mais é do que uma função de variáveis aleatórias.

Existe uma distribuição, desenvolvida por Ronald A. Fischer, distribuição F, que é uma função
de duas variáveis aleatórias, ou seja a variável aleatória F é dada por:

Q1 /gl1
F =
Q2 /gl2

2
Q1 ∼ χ
n1 −1

2
Q2 ∼ χ
n2 −1

Ou seja a distribuição F é a razão de duas variáveis aleatórias independentes com distribuição


de qui-quadrado divido pelos seus resectivos graus de liberdade (gl ). A distribuição possui dois
parâmetros, que são os graus de liberdade do numerador e denominador, Fgl ,gl 1 2

George W. Snedecor em seu livro Statisical Methods (1937) descreveu o teste de razão de
variâncias, chamando de Teste-F em homenagem a Ronald A. Fischer.

Utilando as quantidades amostrais ( que seguem uma distribuição de qui-quadrado


n−1 2
2
)S
σ

com n − 1 graus de liberdade temos.

nA −1 2
( )S /n A − 1
σ
2 A
A
F =
nB −1 2
( )S /n B − 1
σ
2 B
B

2 2
S σ
A B
F = ∼ Fgl
A ,gl B
2 2
S σ
B A

Sabemos, que F ∼ F(gl


A ,gl B )
é uma distribuição F (Fischer) com graus de liberdade glA do
numerador e glB do denominador, e essa distribuição é uma razão de duas variáveis aleatórias
χ
2
n−1
.

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 9/26
15/10/2020 Teste de Hipóteses

Abaixo segue uma simulação do resultado da razão de duas distribuições χ2n−1 e uma
veri cação da distribuição aproximada dessa variável aleatória, para ns didáticos. Ainda, o
teste de Kolmogorov-Smirnov foi aplicado para veri car a adequação desses dados (F ) à uma
distribuição F. O resultado da estatística do teste foi D = 0.00061 , indicando que não pode
ser rejeitado que esses dados vieram de uma distribuição F com os respectivos graus de
liberdade.

Code

Note que a simulação não foi apresentada aqui, porém o codigo se encontra abaixo.

Code

Para se veri car se as variâncias são iguais ou não é necessário recorrer ao teste F (inferência
para duas variâncias de populações normais).

2 2
H0 : σ = σ
A A

2 2
H1 : σ ≠ σ
A A

ou seja, a hipótese nula frente à uma hipótese alternativa, que pode ser, da diferença, ou seja a
razão de variâncias ser diferente de 1, ou superior ou inferior à unidade,

2 2
H0 : σ = σ
A A

sendo a hipótese alternativa uma das seguintes opções:

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 10/26
15/10/2020 Teste de Hipóteses
2 2
H1 : σ ≠ σ
A A

2 2
H1 : σ > σ
A A

2 2
H1 : σ < σ
A A

que são equivalentes às hipóteses:

2
σ
A
H1 : ≠ 1
2
σ
A

2
σ
A
H1 : > 1
2
σ
A

2
σ
A
H1 : < 1
2
σ
A

A estatística do teste é dada por:

Teste para diferença de variâncias

O teste de hipóteses para a diferença de variâncias de duas distribuições normais.

Hipótese nula: hipótese de nulidade, onde não há diferença entre as variâncias.


2
σ
A
H0 : = 1
2
σ
B

Estatística do teste: o quão a razão de variâncias se afastam da unidade

2
S
A
F =
2
S
B

Hipóteses alternativas disponíveis a testar:


2
σ
A
H1 : ≠ 1
2
σ
B

2
σ
A
H1 : > 1
2
σ
B

2
σ
A
H1 : < 1
2
σ
B

Voltando ao caso das amostras recolhidas A e B, testaremos a hipótese que as variâncias são
diferentes entre si.

S
2
A
= 7.3349517

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 11/26
15/10/2020 Teste de Hipóteses

S
2
B
= 8.3419714

Hipóteses
2
σ
Parâmetro de interesse a ser testado: Se σA , consequentemente
2 2 A
≠ σ = 1
B σ
2
B
2
σ
Hipótese nula: H 0
A
: = 1
2
σ
B
2
σ
Hipótese alternativa: H 1
A
: ≠ 1
2
σ
B

Estatística do teste:

Note que por simplicidade no uso das probabilidades da F tabelada opta-se por obter o maior
valor de F calculado, neste caso utilizando no numerador a maior variância amostral da
comparação.
2
S
A
F =
2
S
B

Decisão do teste: Rejeita-se H 0 se o V alor − P (probabilidade de cometer o erro do


Tipo I) for menor que α.

Erro do Tipo I: é a probabilidade em rejeitar a H 0 sendo ela verdadeira.

Cálculos:
2
S 8.3419
A
F = = = 1.1372
2
S 7.3349
B

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 12/26
15/10/2020 Teste de Hipóteses

$test.statistic
[1] 1.137289

$df.num
[1] 14

$df.den
[1] 14

$p.value
[1] 0.8131681

Interpretação

Note que o V alor − P obtido foi de aproximadamente 0.8131681 (área hachurada), teste
bilateral, devido a H 1 ser postulada como a diferença. O V alor − P indica a probabilidade de
comentermos o Erro do Tipo I com base na amostra, ou seja, rejeitarmos a H 0 sendo ela
verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de decisão é
demasiado elevado, superior ao valor arbitrário α = 0.05 . Podemos dizer que não temos
evidência nos dados que demonstrem diferença signi cativa entre as variâncias das amostras
de preparações A e B.

Testando a hipótese da diferença de médias (


μA − μB ) de populações com variâncias

desconhecidas
Voltando ao teste de médias …

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 13/26
15/10/2020 Teste de Hipóteses

Vamos considerar agora o teste de hipóteses para a diferença de duas médias populacionais, de
populações normais com suas variâncias (σA2
, σ ) desconhecidas. Para esses casos trocamos
2
B

as variâncias populacionais por variâncias estimadas a partir das amostras (SA


2
, S ).
2
B

Para tal situação poderiamos ter os seguintes casos: onde as variâncias são iguais, σA
2
= σ
2
B
,e
onde são diferentes σA
2
≠ σ
2
B
.

Caso 1: Variâncias iguais σA


2
= σ
B
2

Para se veri car se as variâncias são iguais ou não é necessário recorrer ao teste F (inferência
para duas variâncias de populações normais).

Dessa forma suponha que tenhamos duas populações normais independentes com médias
desconhecidas e variâncias desconhecidas porém iguais, e desejamos testar as seguintes
hipóteses:

H0 : μA − μB = Δ0

H1 : μA − μB ≠ Δ0

ou seja, a hipótese nula frente à uma hipótese alteranativa, que pode ser, da diferença entre as
médias, ou da superioridade ou inferioridade de uma das médias,

H0 : μA − μB = 0

sendo a hipótese alternativa uma das seguintes opções:

H1 : μA − μB ≠ 0

H1 : μA − μB > 0

H1 : μA − μB < 0

¯
¯¯¯ ¯
¯¯¯
Sabemos que a variância da diferença entre as variáveis aleatórias X A − XB é dada por:

2 2
σ σ
¯
¯¯¯ ¯
¯¯¯ B
V (X A − X B ) = +
nA nB

Sendo as variâncias iguais σA


2
= σ
2
B
= σ
2
, temos que:

2 2
σ σ 1 1
¯
¯¯¯ ¯
¯¯¯ B 2
V (X A − X B ) = + = σ ( + )
nA nB nA nB

Dessa forma combinar as duas estimativas (SA


2
, S ) em uma única (S ) parece razoável. O
2
B
2

estimador combinado das duas variâncias estimadas é também chamado de pooled estimator,
S p , e é dado por:
2

nA − 1 nB − 1
2 2 2
Sp = ⋅ S + ⋅ S
A B
nA + nB − 2 nA + nB − 2

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 14/26
15/10/2020 Teste de Hipóteses

Note que o estimador combinado nada mais é do que uma média das variâncias ponderada
pelos tamanhos das amostras.

Assim a grandeza,
¯
¯¯¯ ¯
¯¯¯
X A − X B − (μ A − μ B )
t =
−−−−−−−
1 1
Sp √ +
nA nB

possui uma distribuição t com n A + nB − 2 graus de liberadade.

A estatística do teste é dada por:

Teste para diferença de médias, variâncias desconhecidas e iguais

O teste de hipóteses para a diferença de médias de duas distribuições normais, variâncias


desconhecidas e iguais.

Hipótese nula: hipótese de nulidade, onde não há diferença entre as médias, as médias seriam
iguais.

H0 : μA − μB = Δ0

Estatística do teste: o quão diferentes são as médias (diferença padronizada)

¯
¯¯¯ ¯
¯¯¯
X A − X B − Δ0
t0 =
−−−−−−−
1 1
Sp √ +
nA nB

Hipóteses alternativas disponíveis a testar:

H1 : μA − μB ≠ Δ0

H1 : μA − μB < Δ0

H1 : μA − μB > Δ0

Exemplo 1 - teste bilateral (≠)

Ensaios aplicados à amostra a duas preparações de concreto tem como objetivo veri car se
existe diferença signi cativa na resistência entre os dois preparos. Para isso foram obtidas e
testadas amostras de ambos os casos.

Tem se interesse em testar a hipótese de que existe diferença entre a resistência mecânica
do preparo do A frente ao preparo B. Foram retiradas 15 amostras do preparo A e 10
amostras do preparo B. Os resultados obtidos a partir das amostras são apresentados na
tabela abaixo.

Considere as variâncias iguais, e um α = 0.05 .

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 15/26
15/10/2020 Teste de Hipóteses

Preparo Média (¯x


x̄ )
¯¯
Desvio Padrão (s) Amostra (n)

Preparo A 28 Mpa 4.1 MPa 15

Preparo B 26 Mpa 3.8 MPa 10

Hipóteses

Parâmetro de interesse a ser testado: Se μ A = μB , consequentemente μ A − μB = 0

Hipótese nula: H 0 : μ A − μ B = 0
Hipótese alternativa: H 1 : μ A − μ B ≠ 0
Estatística do teste:

¯
¯¯¯ ¯
¯¯¯
XA − XB − 0
t0 =
−−−−−−−
1 1
Sp √ +
nA nB

¯
¯¯¯ ¯
¯¯¯
XA − XB
t0 =
−−−−−−−
1 1
Sp √ +
nA nB

¯¯
¯ ¯¯
¯
xA − xB
t0 =
−−−−−−−
1 1
sp √ +
nA nB

Decisão do teste: Rejeita-se H 0 se o V alor − P (probabilidade de cometer o erro do


Tipo I) for menor que α.

Erro do Tipo I: é a probabilidade em rejeitar a H 0 sendo ela verdadeira.

Cálculos:

15 − 1 10 − 1
2 2 2
sp = ⋅ 4.1 + ⋅ 3.8
15 + 10 − 2 15 + 10 − 2

2 2 2
sp = (0.6087) ⋅ 4.1 + (0.3913) ⋅ 3.8 = 15.8826

sp = 3.9853

Code

[1] 3.985299

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 16/26
15/10/2020 Teste de Hipóteses
¯¯
¯
xA − ¯¯
¯
xB
t0 =
−− −−−−−
1 1
sp √ +
nA nB

28 − 26
t0 =
−−−−−−
1 1
3.9853√ +
15 10

t0 = 1.23

Code

[1] 1.229262

Code

$test.statistic
[1] 1.229263

$df
[1] 23

$p.value
[1] 0.2314014

Interpretação

Note que o V alor − P obtido foi de aproximadamente V alor − P = 2 ∗ 0.116 = 0.231


(área hachurada), onde temos um teste bilateral, devido a H 1 ser postulada como a diferença.
O V alor − P indica a probabilidade de comentermos o Erro do Tipo I, ou seja, rejeitarmos a
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 17/26
15/10/2020 Teste de Hipóteses

H0 sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de
decisão é demasiado elevado, V alor − P = 0.231, superior ao valor de α = 0.05 . Podemos
dizer que não temos evidência nos dados que demonstrem diferença signi cativa entre as
preparações A e B.

Exemplo 2 - teste unilateral (< ou >)

Suponha agora que temos o interesse em veri car a hipótese de que a adição de um
determinado aditivo em um dos preparados implica no aumento da sua resistência
mecânica. Sendo assim o tratamento foi adicionar tal aditivio ao preparo A e testar frente
ao preparo B, sem aditivo. Para o referido teste foram retiradas 17 amostras do preparo A
e 17 amostras do preparo B. Os resultados obtidos a partir das amostras são apresentados
na tabela abaixo.

Considere as variâncias iguais, e um α = 0.05 .

As variâncias podem ser testadas para igualdade utilizando um Teste F (Fischer).

Preparo Média (¯¯


x)
¯
Desvio Padrão (s) Amostra (n)

Preparo com aditivo A 29 Mpa 3.7 MPa 17

Preparo sem aditivo B 26 Mpa 3.8 MPa 17

Hipóteses

Parâmetro de interesse a ser testado: Se μ A = μB , consequentemente μ A − μB = 0

Hipótese nula: H 0 : μ A − μ B = 0
Hipótese alternativa: H 1 : μ A − μ B > 0
Estatística do teste:
¯¯
¯ ¯¯
¯
xA − xB
t0 =
−−−−−−−
1 1
sp √ +
nA nB

- Decisão do teste: Rejeita-se H 0 se o V alor − P (probabilidade de cometer o erro do Tipo I)


for menor que α.

Erro do Tipo I: é a probabilidade em rejeitar a H 0 sendo ela verdadeira.

Cálculos:

17 − 1 17 − 1
2 2 2
sp = ⋅ 3.7 + ⋅ 3.8
17 + 17 − 2 17 + 17 − 2

2 2 2
sp = (0.5) ⋅ 3.7 + (0.5) ⋅ 3.8 = 14.065

sp = 3.75

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 18/26
15/10/2020 Teste de Hipóteses

[1] 3.750333

¯¯
¯
xA − ¯¯
¯
xB
t0 =
−− −−−−−
1 1
sp √ +
nA nB

29 − 26
t0 =
−−−−−−
1 1
3.75√ +
17 17

t0 = 2.33

Code

[1] 2.332381

Code

$test.statistic
[1] 2.332173

$df
[1] 32

$p.value
[1] 0.01307213

Interpretação

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 19/26
15/10/2020 Teste de Hipóteses

Note que o V alor − P obtido foi de aproximadamente V alor − P = 0.0131 , onde temos
um teste unilateral, devido a H 1 ser postulada como a a superioridade de uma das médias. O
V alor − P indica a probabilidade de comentermos o Erro do Tipo I, ou seja, rejeitarmos a H 0

sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de
decisão é inferior ao valor de α = 0.05 , V alor − P = 0.0131 . Podemos dizer que temos
evidência nos dados que demonstrem um diferença estatísticamente signi cativa entre as
preparações A e B. Em outras palavras o erro que estaria sendo cometido ao rejeitarmos H 0 é
algo em torno de 1.3 %.

Caso 2: Variâncias diferentes σA


2
≠ σ
B
2

Para se veri car se as variâncias são iguais ou não é necessário recorrer ao teste F (inferência
para duas variâncias de populações normais).

Dessa forma suponha que tenhamos duas populações normais independentes com médias
desconhecidas e variâncias desconhecidas porém diferentes, e desejamos testar as hipóteses
H 0 versus uma H 1 .

¯
¯¯¯ ¯
¯¯¯
Sabemos que a variância da diferença entre as variáveis aleatórias X A − XB é dada por:

2 2
σ σ
¯
¯¯¯ ¯
¯¯¯ B
V (X A − X B ) = +
nA nB

Assim a grandeza,
¯
¯¯¯ ¯
¯¯¯
X A − X B − (μ A − μ B )
t =
−−−−−−−
2 2
SA SB
√ +
nA nB

possui uma distribuição t com v graus de liberadade. Para esse caso os graus de liberdade não
serão mais n A + n B − 2 e sim, calculados pela seguinte expressão:

2 2 2
SA SB
( + )
nA nB

v =
2
2 2
S 2
A S
( ) B
n
A
( )
n
B

+
nA −1 nB −1

A estatística do teste é dada por:

Teste para diferença de médias, variâncias desconhecidas e diferentes

O teste de hipóteses para a diferença de médias de duas distribuições normais, variâncias


desconhecidas e diferentes.

Hipótese nula: hipótese de nulidade, onde não há diferença entre as médias, as médias seriam
iguais.

H0 : μA − μB = Δ0

Estatística do teste: o quão diferentes são as médias (diferença padronizada)

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 20/26
15/10/2020 Teste de Hipóteses
¯
¯¯¯ ¯
¯¯¯
X A − X B − Δ0
t0 =
−−−−−−−
2 2
SA SB
√ +
nA nB

Hipóteses alternativas disponíveis a testar:

H1 : μA − μB ≠ Δ0

H1 : μA − μB < Δ0

H1 : μA − μB > Δ0

Exemplo 3 - teste bilateral (≠)

Um psicólogo estava interessado em explorar se os estudantes universitários do sexo


masculino e feminino têm ou não diferentes comportamentos de condução. Havia uma série
de maneiras que ela poderia quanti car comportamentos de condução. Ela optou por se
concentrar na velocidade mais rápida já dirigida por um indivíduo. Portanto, a questão
estatística em particular que ele formulou foi a seguinte:

Seria a maior velocidade média conduzida por estudantes universitários do sexo masculino
diferente da maior velocidade média conduzida por estudantes universitários do sexo
feminino?

Ele realizou um levantamento de uma amostra aleatória n A = 34 estudantes universitários


do sexo masculino e n B = 29 estudantes universitários do sexo feminino.

Existe evidência su ciente no nível α = 0.05 para concluir que a maior velocidade média
conduzida por estudantes universitários do sexo masculino difere da maior velocidade
média de estudantes universitários do sexo feminino?

Considere as variâncias diferentes.

O resumo descritivo dos resultados de sua pesquisa:

Grupo Média (¯¯


x)
¯
Desvio Padrão (s) Amostra (n)

Masculino A 105.5 20.1 34

Feminino B 90.9 12.2 29

Hipóteses

Parâmetro de interesse a ser testado: Se μ A = μB , consequentemente μ A − μB = 0

Hipótese nula: H 0 : μ A − μ B = 0
Hipótese alternativa: H 1 : μ A − μ B ≠ 0
Estatística do teste:

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 21/26
15/10/2020 Teste de Hipóteses
¯¯
¯
xA − ¯¯
¯
xB
t0 =
−−−−−−−
2 2
SA SB
√ +
nA nB

Decisão do teste: Rejeita-se H 0 se o V alor − P (probabilidade de cometer o erro do


Tipo I) for menor que α.

Erro do Tipo I: é a probabilidade em rejeitar a H 0 sendo ela verdadeira.

Cálculos:

Suposições: Vamos assumir que as variáveis aleatórias maiores velocidades (masculino e


feminino) são normalmente distribuidas e que cada amostra é independente.

Calculando os graus de liberdade, v :

2 2
2
20.1 12.2
( + )
34 29

v = = 55.5 = 55
2 2
20.1 2
12.2
( ) ( )
34 29

+
34−1 29−1

Calculando a estatística do teste:

105.5 − 90.9
t0 =
−−−
2
−−−−−−
2
20.1 12.2
√ +
34 29

t0 = 3.54

Code

[1] 3.539453

Code

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 22/26
15/10/2020 Teste de Hipóteses

$test.statistic
[1] 3.539453

$df
[1] 55

$p.value
[1] 0.0008242127

Interpretação

O valor crítico para rejeição da hipótese nula H 0 em favor da hipótese alternativa H 1 é:

t0 > t0.025,55 = 2.004

Esse valor crítico pode ser obtido na tabela da distribuição t para α/2 = 0.05/2 = 0.025 pois
é um teste bilateral, na curva com graus de liberadade igual a 55.

Note que o V alor − P obtido foi de aproximadamente p = 2 ∗ 0.000412 = 0.000824 (área


hachurada), onde temos um teste bilateral, devido a H 1 ser postulada como a diferença. O
V alor − P indica a probabilidade de comentermos o Erro do Tipo I, ou seja, rejeitarmos a H 0

sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de
decisão é bastante pequeno, V alor − P = 0.000824, inferior ao valor de α = 0.05 . Podemos
dizer que temos evidência nos dados que demonstram diferença signi cativa entre as
velocidades médias do grupo A e B.

(https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR)

Este conteúdo está disponível por meio da Licença Creative Commons 4.0
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 23/26
15/10/2020 Teste de Hipóteses

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 24/26
15/10/2020 Teste de Hipóteses

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 25/26
15/10/2020 Teste de Hipóteses

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 26/26

Você também pode gostar