Você está na página 1de 39

Inferência Estatística

Teste de Hipóteses
Teste de Hipóteses:

Hipótese é uma afirmação sobre um parâmetro da


população, p.e., sobre a média de uma variável na
população (μ) ou sobre uma proporção populacional (p).

Teste de Hipóteses é o processo de decisão entre duas


hipóteses sobre um parâmetro da população.

- Hipótese Nula (H0): ponto de partida


- Hipótese Alternativa (H1): hipótese do pesquisador
Erros associados a um Teste de Hipóteses

Erro tipo I: Rejeitar H0 quando H0 é verdadeira.


Erro tipo II: Não rejeitar H0 quando H0 é falsa.
Erros associados a um Teste de Hipóteses
O Erro Tipo I geralmente é o mais grave.
Assim pretende-se “controlá-lo”, pré-fixando sua
probabilidade de ocorrência em um valor pequeno α:

P(Erro tipo I) = P(Rejeitar H0 quando H0 é verdadeira) = α.

Este valor pré-fixado para a probabilidade do Erro Tipo I é


chamado nível de significância do teste.

Usualmente tem-se: α = 0.10 ou α = 0.05 ou α = 0.01.

Se for fixado o valor de α = 0.05, diz-se que


“é um teste de hipóteses ao nível de significância de 5%”.
Erros associados a um Teste de Hipóteses

P(Erro tipo II) = P(Não rejeitar H0 quando H0 é falsa) = β.

β é reduzido aumentando-se o tamanho da amostra

Poder do teste =P(Rejeitar H0 quando H0 é falsa) = 1- β.

Um teste de hipótese com um poder de 90%, por exemplo,


rejeitará H0, quando ela for falsa, com 90% de probabilidade.
Componentes de um Teste de Hipóteses
Hipótese nula: é a afirmação sobre o valor de um parâmetro
populacional: média (μ), variância (σ2) ou proporção (θ).

Usualmente, H0 expressa a condição de igualdade.


H 0: μ = μ 0

Hipótese alternativa: é a afirmação verdadeira para o caso


de a hipótese nula ser falsa.

Assume uma de três formas:


H 1: μ ≠ μ 0 , H 1: μ > μ 0 ou H1: μ < μ0.

Nível de significância do teste: Probabilidade máxima


tolerada para o Erro Tipo I (rejeitar H0 se ela é verdadeira).
Componentes de um Teste de Hipóteses
Estatística de teste: mede a distância entre o que foi
observado na amostra e o que seria esperado se a hipótese
nula fosse verdadeira.
̄x − μ 0
Teste sobre uma média μ: H 0: μ = μ 0 T obs =
s/√n

( n−1 ) s 2
Teste sobre uma variância σ2: H 0: σ 2 = σ 20 X 0=
σ 02

p̂ − p 0
Teste sobre uma proporção p: H0: p = p0 Z obs=

√ p 0 ( 1− p 0 )
n
Distribuição de Referência: conforme o parâmetro testado, uma
distribuição de probabilidades é associada à estatística de teste.
Teste sobre uma ̄x − μ 0
média μ: T obs = T-Student (n-1) g.l.
H0: μ = μ0
s/√n

( n−1 ) s 2
Teste sobre uma X 0= Qui-Quadrado (n-1)g.l.
variância σ2: σ 02
H0: σ2 = σ20
p̂ − p 0
Teste sobre uma Z obs= Normal Padrão
proporção p:
H0: p = p0
√ p 0 ( 1− p 0 )
n

Se H0 é verdadeira, a estatística de teste segue a distribuição de


referência, ou seja, se H0 é verdadeira, então o valor da estatística
de teste deve ser um valor típico da distribuição de referência.
Exemplo 1:

Uma indústria farmacêutica especifica que em certo


analgésico a quantidade média de ácido acetilsalicílico
deve ser 5.5 mg por comprimido.

A indústria suspeita que houve problemas na produção de


um determinado lote e que, nesse lote, a quantidade média
dessa substância está diferente da especificada.

Para verificar essa suspeita, a indústria selecionou uma


amostra aleatória de 50 comprimidos desse lote, observando
uma quantidade média de ácido acetilsalicílico igual a 5.8
mg e um desvio-padrão de 0.85 mg.

Os dados da amostra confirmam a suspeita da indústria, ao


nível de 2% de significância?
Exemplo 1: Teste de Hipóteses sobre uma Média

Parâmetro:
μ = quantidade média de ácido acetilsalicílico (em mg)
de certo analgésico da indústria farmacêutica no lote suspeito

Valor de comparação: μ0 = 5.5

Hipóteses
H0: μ = 5.5 Nível de significância: α = 0.02
H1: μ ≠ 5.5

Dados amostrais: n= 50, ̄x =5. 8, s= 0 . 85.

Estatística de teste:
̄x − μ 0 ( 5 .8−5 .5 ) 0.3
T obs = = = = 2 . 50
s/√n 0 .85 / √50 0 . 12
Nível de significância:
α = 0.02 T49

Estatística de teste:
tobs = 2.50

-2.41 2.41
tobs = 2.50
Conclusão:
não é
Rejeitar a hipótese nula de que μ = 5.5 “típico”
(em favor da hipótese alternativa μ ≠ 5.5).

Conclusão em termos do problema:

“Ao nível de significância de 2%, há evidências estatísticas


suficientes nesta amostra para se dizer que a quantidade média
de ácido acetil salicílico por comprimido é diferente de 5.5 mg”.
Formas das hipóteses
Sobre a média populacional μ:

H 0: μ = μ 0 H 0: μ = μ 0 H 0: μ = μ 0
H1: μ< μ0 H 1: μ > μ 0 H 1: μ ≠ μ 0

̄x − μ 0
T obs =
s/√n
Probabilidade de Significância (Valor P)
Valor p: probabilidade de cometer o Erro Tipo I com base nos dados
amostrais, ou seja, é a probabilidade de errar ao rejeitar a hipótese
nula nesta amostra.
É calculado na distribuição de referência da estatística de teste.

Conclusão: a amostra não


contém evidências suficientes
NÃO para a rejeição da afirmação
da hipótese nula.

O valor P é menor do que o


valor do que o nível de
significância (α)? Conclusão: a amostra contém
SIM evidências suficientes para a
rejeição da hipótese nula.
Lembrando que

o nível de significância (α) é o valor máximo


pré-fixado para a probabilidade de Erro Tipo I;
o valor de α é arbitrário e definido pelo pesquisador.

De posse dos dados amostrais, podemos perguntar:

Qual é a probabilidade de errarmos ao rejeitar a


hipótese nula com esses dados amostrais ?

Essa probabilidade é o valor P do teste


Então, o Valor P é

a probabilidade de errar ao decidir pela rejeição da


hipótese nula com base nos dados observados.

Método do valor P

Se valor p < α → Rejeita-se H0 ao nível de significância α

Se valor p ≥ α → Não se rejeita H0 ao nível de


significância α
Raciocínio no qual se baseia o método do valor p

Se o valor p é “pequeno”, a probabilidade de cometermos um


erro ao rejeitarmos H0 é pequena.
Então, devemos rejeitar H0.

Se o valor p é “grande”, a probabilidade de cometermos um


erro ao rejeitarmos H0 é grande.
Então, não devemos rejeitar H0.

“pequeno”

em comparação com α

“grande”
Exemplo 1: Conclusão: a amostra não
contém evidências suficientes
NÃO para a rejeição da afirmação
O valor observado para da hipótese nula.
a estatística de teste
pode ser considerado
“grande” ? Conclusão: a amostra contém
SIM evidências suficientes para a
rejeição da hipótese nula.

O valor da estatística de teste é


comparado aos valores da
distribuição de referência.

Distribuição t com n-1 g.l.

Se estiver entre os α% maiores,


será considerado grande.
Como calcular o valor p de um teste de hipóteses?

O valor p é a probabilidade de a estatística de


teste ter valores mais “extremos” do que seu
valor calculado com os dados amostrais,
supondo H0 verdadeira.
Exemplo 1 (cálculo do valor-p):
H0: μ = 5.5
α = 0.02 Tobs = 2.50
H1: μ ≠ 5.5

Valores “mais extremos” do que Tobs


-2.50 2.50

menores maiores
-2.50 2.50

Valor p = P[t49 < -2.50] + P[t49 > 2.50]


= 2 x P[t49< -2.50]
Como o valor p é menor do que o nível
≈ 2 x P[Z< -2.50] de significância adotado (0.013 < 0.02),
= 0.013 então rejeita-se H ao nível de 2% de
0
significância.
Tabela Normal-padrão
̄x − μ 0
De maneira geral T obs =
s/√n
Hipóteses Rejeita-se H0 Região de Rejeição Valor p
(ao n.s = α) de H0

H0: μ = μ0
H1: μ< μ0 Tobs < −t( n −1;α) P(T(n-1) < Tobs)

H 0: μ = μ 0
Tobs > t( n −1;α) P(T(n-1) > Tobs)
H 1: μ > μ 0

Tobs < −t( n −1;α)


H 0: μ = μ 0
ou 2 x P(T(n-1) > |Tobs |)
H 1: μ ≠ μ 0 Tobs > t( n −1;α)
Teste de Hipóteses para a Variância
de uma População Normal
Algumas vezes, precisamos do I.C. sobre a variância σ2.
Em uma a.a. X1, X2, ..., Xn, a variância amostral

é um estimador de σ2.

Em outras situações podemos fazer teste de hipóteses do tipo

H 0: σ = σ 0
2 2 ou H0: σ2 = σ20 ou H 0: σ 2 = σ 20
H1: σ2≠ σ20 H1: σ2< σ20 H 1: σ 2> σ 20

quando a distribuição da variável X for Normal.


Resultado:

Assim, se H0: σ2 = σ20 é verdadeira, a estatística de teste

tem distribuição qui-quadrado com n-1 graus de liberdade.


H 0: σ 2 = σ 20 H 0: σ 2 = σ 20 H0: σ2 = σ20
H 1: σ 2≠ σ 20 H 1: σ 2< σ 20 H1: σ2> σ20
Exemplo: Máquina automática de encher garrafas com
detergente líquido. A variância σ2 do volume dispensado não deve
exceder 0.01 (onça fuida)2.

H0: σ2 = 0.01
H1: σ2 > 0.01.

Em uma amostra com n=20 valores, encontrou-se s2 = 0.0153.

Com α = 0.05, rejeita-se H0 se > [0.05,19]


= 30.14.

Resultado: como 29,07 < 30.14 não se rejeita H0 ao n.s. de 5%.

Conclui-se que não há evidência nesta amostra para se concluir


que a variância do volume dispensado pela máquina exceda 0.01.
Valor P

H0: σ = σ 0
2 2 valor p = P ( χ 2n−1 ≤ χ 20 )
H1: σ2 < σ20

H0: σ = σ
2 2 valor p = P ( χ 2n−1 ≥ χ 20 )
0
H1: σ2 > σ2
0

H0: σ = σ
2 2 valor p = 2⋅P ( χ 2n−1 < χ 20 ) se χ 20 <χ 2[ 0 . 50 ]
0
H1: σ2 ≠ σ2 valor p = 2⋅P ( χ 2n−1 > χ 20 ) se χ 20 >χ 2[ 0 . 50 ]
0
Exemplo: Máquina automática de encher garrafas.
H0: σ2 = 0.01
H1: σ2 > 0.01.
valor p = P ( χ 2n−1 ≥ χ 20 ) = P ( χ 219> 29 . 07 )=0. 065,

Que foi obtido em um programa computacional.


Mas e se tivermos apenas uma tabela qui-quadrado?
Na tabela qui-quadrado, na linha com 19 g.l., temos que
P ( χ 219 > 27 . 204 )=0 .10,
P ( χ 219 > 30 .144 ) =0 . 05,

Como 27 . 204 < 29 . 07 < 30 .144,


Então P ( χ 219 >30 . 144 ) < P ( χ 219 > 29 . 07 ) < P ( χ 219 >27 . 204 )
Ou seja 0 . 05 < valor p < 0 . 10 .
Resultado: como o valor p > 0.05 não se rejeita H0 ao n.s. de 5%.
Teste de Hipóteses para a Proporção
Em algumas situações, precisamos do I.C. e ou de um T.H.
sobre uma proporção p de uma variável aleatória binomial.

Ex.: processo de fabricação que fabrica itens classificados


como aceitáveis ou defeituosos, p é a proporção de
defeituosos.

Em uma amostra aleatória Y1, Y2, …, Yn, onde

Yi = 1, se a característica está presente;


Yi = 0, caso contrário;
Denotamos X = Σni=1 Yi.
Um estimador não viciado de p é a proporção amostral
p = x/n.
.
Os teste de hipóteses são do tipo
H 0: p = p 0 ou H 0: p = p 0 ou H 0: p = p 0
H 1: p ≠ p 0 H 1: p < p 0 H 1: p > p 0

Usando a estatística de teste


O valor da estatística de teste é comparado aos valores da
distribuição de referência:
Distribuição Z, ou seja, a Normal Padrão
Se Zobs estiver entre os valores maiores que Zα, será
considerado grande.

Exemplo:
Zobs = 3.4 é maior que 2.33, então rejeita-se H0 ao n.s. de 1%,
Assim, ao n.s. de 1%, há evidência suficiente para rejeitar a
hipótese H0: p = p0.
Hipóteses, Região crítica e Valor P

H0: p = p0 ou H0: p = p0 ou H 0: p = p 0
H1: p ≠ p0 H1: p < p0 H 1: p > p 0,

Z0 < -Zα/2 Z0 < -Zα Z0 > Z α


Z0 > Zα/2

valor p = 2P(Z > |Z0|) valor p = P(Z < Z0) valor p = P(Z > Z0)
Exemplo 3: Teste de Hipóteses sobre uma Proporção
Parâmetro:
p = proporção de meninas em nascimentos usando um
produto para aumentar o número de nascimento de meninas.

Valor de comparação: p0 = 0.5

Hipóteses
H0: p = 0.5 Nível de significância: α = 0.01
H1: p > 0.5

Dados amostrais: n=100, p = 67/100 = 0.67

Estatística de teste: p̂ − p
0 0 . 67−0 . 5 0 . 17
Z obs= = = =3 . 4
0 . 05
√ p 0 ( 1− p 0 )
n √ 0 .5 ( 1−0 . 5 )
100
Hipóteses
H0: p = 0.5
H1: p > 0.5

Zobs = 3.4 > Zα = 2.33, então rejeita-se H0, ao nível de 1%


de significância.

O Valor p = P[Z > 3.4] ≈ 0.


Exemplo: Defeitos em semicondutores. Fabricantes quer mostrar que
proporção de defeitos atende especificações de < 0.05.

Parâmetro: p proporção de defeitos.

Hipóteses: H0: p = 0.05 vs H1: p < 0.05.

Nível de significância: α = 0,05.


̂p − p 0
Estatística de teste: Z 0= .
√ p 0 ( 1− p0 ) / n
Região de rejeição: Z0 < -Z0.05 = -1.645.

Amostra: n = 200, x=4, p = x/n = 4/200 = 0.02.


0 . 02−0 . 05
Cálculos: Z 0= =−1,95
√ 0 .05 ( 0 . 95 ) / 200
Resultado: Como -1.95 < -1.645, rejeita-se H0 ao n.s. de 5%.

Conclusão: A indústria atende às especificações.

Valor p = P(Z < Z0) = P(Z < -1.95) = 0.0256 (< α).
Passos para Teste de Hipóteses

1) Definir o parâmetro (média ou variância ou proporção)


sobre o qual é feito o teste.

2) Definir a hipótese do pesquisador.

3) Definir a hipótese nula (H0) e hipótese alternativa (H1).

4) Escolher um valor α para o nível de significância do teste.

5) Definir a estatística de teste.

6) Calcular o valor observado da estatística de teste na


amostra retirada da população.
Intervalos de Confiança e Testes de Hipóteses

Intervalos de Confiança podem ser usados para se fazer


Testes de Hipóteses Bilaterais.

H0: μ = μ0
H1: μ ≠ μ0

A região de não-rejeição de um teste bilateral sobre μ é


o intervalo de confiança para μ.
Intervalos de Confiança e Testes de Hipóteses
Região de Rejeição Região de Não-Rejeição

Tobs < −t( n −1; α/2) -t( n −1; α/2) < Tobs < t( n −1; α/2)

OU
-t( n −1; α/2) < ̄x − μ < t( n −1; α/2)
Tobs > t( n −1; α/2) s√ n

-t( n −1; α/2). s/ √ n < μ0 < t( n −1; α/2). s/ √ n

Se um intervalo com 100(1-α)% de confiança é usado para se


fazer um teste bilateral, o nível de significância associado ao
teste é α%.
Como usar um Intervalo de Confiança
para fazer um Teste de Hipóteses ?

H0: μ = μ0
H1: μ ≠ μ0
rejeitamos H0 ao nível
NÃO de α% de significância

O intervalo de 100(1-α)%
de confiança para μ
contém o valor μ0?
não rejeitamos H0 ao
SIM
nível de α% de
significância
Exemplo:
O teste Charpy V-notch (CVN) mede a energia de impacto (em
J) e é frequentemente usado para determinar se um material
experimenta ou não uma transição dúctil-frágil com um
decréscimo de temperatura.

Em um experimento com 10 corpos-de-prova de aço A238,


cortados a 60oC, a energia de impacto média foi de 64,46 J e o
desvio-padrão foi de 1.07 J.

Considerando que energia de impacto seja normalmente


distribuída, a energia de impacto média nas placas de aço A238
está entre 63.84 J e 65.08 J, com 95% de confiança.

Supondo que uma norma de qualidade determine que a energia


de impacto média seja de 64.0 J. Os resultados do experimento
mostram evidências estatísticas contra a hipótese de que as
placas de aço do lote atendem à norma de qualidade?

Você também pode gostar