Você está na página 1de 5

UNIVERSIDADE FEDERAL DO PIAUÍ - UFPI

CENTRO DE CIÊNCIAS DA NATUREZA II - CCNII


DEPARTAMENTO DE ESTATÍSTICA - CBEST
Disciplina: probabilidade e Estatística. Professora: Lya Raquel

Inferência Estatística: Testes de Hipóteses

Estudaremos agora um método para fazer inferência sobre valores de parâmetros


populacionais. Iremos admitir um valor hipotético para um parâmetro populacional, e com base nas
informações de uma amostra realizaremos um teste estatístico, para rejeitar ou não o valor
hipotético. Como a decisão para aceitar ou rejeitar a hipótese será tomada de acordo com
elementos de uma amostra (ou seja, condições de incerteza), fica evidente que a decisão estará
sujeita a erros. Entretanto, como veremos adiante, podemos dimensionar a probabilidade (risco) da
decisão de rejeitar ou não uma hipótese estatística.

PRINCIPAIS CONCEITOS

Hipótese estatística: Trata-se de uma afirmação feita, a priori, sobre um parâmetro


populacional. São exemplos de hipóteses estatísticas:
a) A altura média da população brasileira é de 1,65 m, isto é: µ = 1,65m.
b) A proporção de piauienses com a doença X é maior que 20%, ou seja: p > 0,20.
c) O equipamento A produz peças com variabilidade menor que o equipamento B.(σ2A< σ2B)
Estatística de Teste: é uma estatística escrita em função do parâmetro de interesse e de um
bom estimador desse parâmetro.
Região crítica (RC): é a região da estatística de teste em que a hipótese nula é rejeitada.
Estabelecer as hipóteses estatísticas depende exclusivamente da natureza do problema em estudo.
Região de não Rejeição (RNR): é a região da estatística de teste em que a hipótese nula não é
rejeitada.

TESTE DE HIPÓTESE

É uma regra de decisão para rejeitar ou não uma hipótese estatística com base nos elementos
amostrais. São dois os tipos de hipóteses:
Designa-se H 0 , chamada hipótese nula, a hipótese estatística a ser testada, e H1 , a hipótese
alternativa que afirma algo que contrarie H 0 . A hipótese nula é expressa por uma igualdade,
enquanto a hipótese alternativa é dada por uma desigualdade.

Exemplos de hipótese nula:


H 0 : µ = 1,65m ou H 0 : µ ≥ 1,65m ou H 0 : µ ≤ 1,65m
Exemplos de hipótese alternativa:
H1 : µ ≠ 1,65g ou H1 : µ < 1,65m ou H1 : µ > 1,65m
(bilateral) (unilateral à esquerda) (unilateral à direita)

Para entender como um teste de hipótese funciona, suponha que estamos interessados em
verificar se o verdadeiro desempenho dos veículos (km/litro de combustível), de determinada marca,
equipados com motores 1.6 seja de 14km/l, como afirma o fabricante, ou se esta é inferior a 14km/l.
Então deve-se formular as seguintes hipótese estatísticas:

 H 0 : µ = 14km / l

 H 1 : µ < 14km / l
Para verificar a veracidade de Ho deve-se conduzir um experimento (coletar uma amostra), no
qual será medida o desempenho de vários carros dessa marca com motor 1.6, que fornecerão uma
estimativa do desempenho média, e sua variância, a partir das quais, verifica-se a veracidade da
hipótese Ho. Suponha que a amostra forneceu média de consumo de 13 km/l, com variância
4(Km/l)2. Pelo simples fato desta amostra ter apresentado uma média inferior a informada pelo
fabricante (14 km/l), não se pode concluir que esta afirmativa seja falsa, pois como já é sabido, esta
estimativa está sujeita a uma distribuição amostral. Precisamos saber se a média amostral é
significativamente inferior à média populacional, supondo que Ho seja verdadeira.
Caso a média amostral não seja significativamente inferior à média populacional, supondo
que Ho seja verdadeira, não haverá nenhuma razão para duvidar da veracidade de Ho. Nesta situação
dizemos que a diferença observada entre a média amostral (13 km/l) e a populacional (14 km/l) não
é significativa.
Caso a média amostral seja significativamente inferior à média populacional, supondo que Ho
seja verdadeira, há razões para acreditar que a verdadeira média populacional seja menor do que se
imaginava, ou seja, o verdadeiro desempenho deve ser menor que 14 km/l. Nesta situação, diz-se
que a diferença foi significativa, portanto a hipótese Ho deve ser rejeitada (o teste foi significativo).
Ou seja, a hipótese nula é tida como verdadeira se em sua avaliação não forem
encontrados indícios que a desaprovem, permanecendo assim até que se prove o contrário.

TIPOS DE ERROS

Há dois possíveis tipos de erros, quando realizamos um teste estatístico para rejeitar ou não
Ho: Podemos rejeitar Ho, quando ela é verdadeira, ou podemos não rejeitá-la, quando ela é falsa.
O erro de rejeitar Ho, sendo Ho verdadeira, é denominado Erro tipo I, e a probabilidade de se
cometer o Erro tipo I é designada por α.
Por outro lado, o erro de não rejeitar Ho, sendo Ho falsa, é denominado Erro tipo II, e a
probabilidade de cometer o Erro tipo II é designada por β. Para que um teste de hipótese seja
considerado bom deve-se ter uma pequena probabilidade de rejeitar Ho se esta for verdadeira, mas
também, uma grande probabilidade de rejeitá-la se ela for falsa.
Os possíveis erros e acertos de uma decisão com base em um teste de hipótese estatístico
estão sintetizados no quadro a seguir:

Realidade
Ho é verdadeira Ho é falsa
Rejeitar Ho ERRO TIPO I Decisão Correta
Decisão
Não rejeitar Ho Decisão Correta ERRO TIPO II

Observe: o Erro tipo I só poderá ser cometido quando se rejeitar Ho, enquanto o Erro tipo II
poderá ocorrer quando não se rejeitar Ho.
O tomador de decisão deseja, obviamente, reduzir ao mínimo as probabilidades dos dois tipos
de erros. A redução simultânea, dos erros poderá ser alcançada pelo aumento do tamanho da
amostra, evidentemente, com aumento dos custos e do tempo da pesquisa. Para um mesmo tamanho
de amostra, a probabilidade de incorrer em um Erro tipo II aumenta à medida que diminui a
probabilidade do Erro tipo I, e vice-versa.

Configuração sobre o mecanismo dos erros

Para compreender o relacionamento dos erros e suas dimensões, vamos idealizar uma
configuração a partir de um exemplo:
Desejamos testar Ho: µ = 14km/l contra H1: µ < 14km/l do exemplo anterior. Sabemos que a
população é normalmente distribuída, que a variância da amostra foi de 4(Km/l) 2 e que a amostra é
de tamanho 9. Para valores de X próximos de 14, temos que Ho não será rejeitada. Como H1: µ <
14km/l , então devemos ter um limite crítico à esquerda para valores de X . Dessa forma, usando a
distribuição de X (t-Student com 8 graus de liberdade) e atribuindo valores para α podemos
calcular o valor x tal que P ( X < x ) = α . Fazendo α = 5%, teremos x = 14 − 1,8595 23 ≅ 12,76 .

Assim, a regra de decisão para Ho será:

Rejeitar Ho, quando X < 12,76. Não rejeitar Ho, quando X ≥ 12,76.

É fácil constatar na distribuição de X que há grande probabilidade de não rejeitar Ho: µ =


14km/l - 95% - e pouca probabilidade - apenas 5% - de rejeitar Ho. Ora, quando não se rejeita a
hipótese Ho, pode-se estar cometendo o Erro tipo II – não rejeitar Ho, quando Ho é falsa. No exemplo,
essa probabilidade de Erro pode ser de 95% quando Ho for falsa, fato extremamente preocupante.
Por outro lado, há apenas 5% de chances de rejeitar Ho. Todavia, quando se rejeita Ho, pode-se estar
cometendo o Erro tipo 1 – rejeitar Ho, quando Ho é verdadeira. Como a probabilidade neste caso é
relativamente baixa - 5% -, a decisão de rejeitar Ho é muito mais segura do que a decisão de não
rejeitar Ho. Esta é a lógica do teste de significância:

· Atribuem-se baixos valores para α, geralmente de 1% a 10%.


· Formula-se Ho com a pretensão de rejeitá-la (hipótese de nulidade).
· Se o teste indicar a rejeição de Ho, há um indicador mais seguro para a decisão.
· Caso o teste indique a não rejeição de Ho, diz-se que, com o nível de significância α, não se
pode rejeitar Ho. Nestes casos a decisão não é tão segura quanto a decisão de rejeitar Ho.

Nas aplicações dos testes de hipóteses a resultados de pesquisas empíricas, considera-se


apenas a probabilidade de cometer o Erro do Tipo I, ou seja, α. Como foi explicado, a indicação da
rejeição de Ho, com baixo risco, implica melhor decisão.

-Mecânica Operacional de Aplicação de Testes:


1- Formular as hipóteses H 0 e H1 , segundo a natureza do problema em estudo.
2- Escolher a estatística de teste adequada.
3- Especificar o nível de significância α e estabelecer a região crítica (ou região de rejeição).
A região crítica será determinada por meio da hipótese H1 e de acordo com .
4- Calcular o valor da estatística de teste (baseado em uma amostra extraída da população).
5- Se o valor da estatística pertencer à região crítica, rejeita-se H 0 , caso contrário, não se
rejeita H 0 com nível de significância α.

CASOS ESPECÍFICOS DE TESTE DE HIPÓTESE:

Teste para a Média Populacional de uma população Normal quando o Desvio Padrão da
População é conhecido.

X −µ
Neste caso a estatística de teste é dada por: Z = ~ N (0,1)
σ n
Exemplo: Um fabricante de fio de arame alega que seu produto tem uma resistência média à
ruptura superior a 10 Kg, com desvio padrão de 0,5 Kg. Um consumidor resolve testar essa
afirmativa. Extrai uma amostra de 50 peças de arame, a qual acusou média de 10,4 Kg. Com α =
0,05 é possível afirmar que é válida a alegação do fabricante?

 H 0 : µ ≤ 10  H 0 : µ = 10
Solução:  ou  (teste unilateral à direita)
 H1 : µ > 10  H1 : µ > 10
A região crítica será do tipo: (ztab, +∞), pois o teste é unilateral à direita e a distribuição da
estatística de teste é normal. O valor ztab será tal que P(Z>ztab)=5%. Logo, ztab=1,645 e a RC = (1,645;
+∞). Sob a hipótese nula, o valor da estatística de teste será:

x−µ 10,4 − 10
z= = = 5,66
σ n 0,5 50
Decisão: Como 5,66 é maior que 1,645, ou seja, 5,66 pertence à região crítica, devemos
rejeitar H 0 com risco de 5%, ou seja, há evidência de que a resistência média seja superior a 10 Kg,
como alegado pelo fabricante.

Teste de Hipóteses para a Média Populacional de uma população Normal com desvio padrão
populacional desconhecido

X −µ
Neste caso a estatística de teste é dada por: t = ~ t ( n −1)
s n
Exemplo: Os registros dos últimos anos de um colégio atestam para os calouros admitidos
uma nota média 115 (teste vocacional). Para testar, com nível de significância de 5%, a hipótese de
que a média de uma nova turma é a mesma das turmas anteriores, retirou-se, ao acaso, uma amostra
de 20 notas, obtendo-se média 118 e desvio padrão 20. Podemos considerar que a média mudou?

 H 0 : µ = 115
Solução:  (teste bilateral)
 H 1 : µ ≠ 115
A região crítica será do tipo: (-∞, -ttab)∪(ttab, +∞), pois o teste é bilateral e a distribuição da
estatística de teste é t-Student com 19 graus de liberdade. O valor ttab será tal que P(-ttab<t<ttab)=95%.
Logo, ttab=2,093 e a RC = (-∞, -2,093)∪(2,093, +∞). Sob a hipótese nula, o valor da estatística de
teste será:
x−µ 118 − 115
t= = ≅ 0,67
s n 20 20
Como o valor calculado 0,67 não pertence à RC, então não podemos rejeitar H 0 com nível de
significância de 5%, ou seja, não rejeitamos que a média da nova turma seja igual a 115.

Teste para o valor da Proporção populacional

Proporção: Uma fração ou porcentagem que indica uma parte da população ou da amostra que
tem um particular traço de interesse. A proporção amostral é denotada por p onde:

número de sucessos na amostra


p=
tamanho da amostra
p− p
Z= ~ N (0,1)
Nesse caso a estatística de teste será: p (1 − p )
n

Exemplo: Um jornal alega que 25% dos seus leitores pertencem à classe A. Se em uma amostra de
740 leitores encontramos 156 de classe A, qual a sua decisão a respeito da veracidade da alegação
veiculada pelo jornal com 5% de significância?
 H 0 : p = 0, 25 156
 p= = 0, 21
 H1 : p ≠ 0, 25 740

A região crítica será do tipo: (-∞, -ztab)∪(ztab, +∞), pois o teste é bilateral e a distribuição da
estatística de teste é normal. O valor de ztab será determinado de tal forma que P(-ztab<Z<ztab)=95%.
Logo, ztab=1,96 e a RC = (-∞, -1,96)∪(1,96, +∞). Sob a hipótese nula, o valor da estatística de teste
será:
0, 21 − 0, 25
zc = = −2,52
0, 25.0, 75
740
Como -2,52 < -1,96 (valor limite da região crítica) então rejeitamos H 0 , ou seja, a proporção de
leitores de classe A é diferente de 25%, com α = 0,05.

Teste de Hipóteses para a Variância populacional

(n − 1) s 2
A Estatística do teste será: ~ χ (2n −1)
σ 2

Exemplo: Para avaliar certas características de segurança de um carro, um engenheiro precisa saber
se o tempo de reação dos motoristas a uma determinada situação de emergência tem variância de
0,0001 , ou se é superior a 0,0001. Se o engenheiro obtém s = 0,014 para uma amostra de tamanho n
= 15, qual é a sua conclusão ao nível de 0,05 de significância?

 H 0 : σ 2 ≤ 0, 010  H 0 : σ 2 = 0, 010
 ou 
 H1 : σ > 0, 010  H1 : σ > 0, 010
2 2

A região crítica será do tipo: ( χ sup , +∞), pois o teste é unilateral à direita e a distribuição da
2

estatística de teste segue a distribuição do qui-quadrado com 14 graus de liberdade. O valor χ sup
2

será tal que P( χ 142 > χ sup )=5%. Logo, χ sup


2 2
=23,685 e a RC = (23,685, +∞).
(15 − 1)0,014 2
Sob a hipótese nula, o valor da estatística de teste será: χ cal
2
= = 27,44
0,0001
Como χ cal = 27,44 excede 23,685 (o valor tabelado), a hipótese nula deve ser rejeitada; em outras
2

palavras, o engenheiro pode concluir que a variância dos tempos de reação dos motoristas a
determinada situação de emergência é superior a 0,0001, com significância de 5%.

Probabilidade de Significância (ou p-valor)

O método de construção de um teste de hipóteses, descrito nas seções anteriores, parte da


fixação do nível de significância α. Pode-se argumentar que esse procedimento pode levar à rejeição
da hipótese nula para um valor de α e à não-rejeição para um valor menor. Outra maneira de
proceder consiste em apresentar a probabilidade de significância ou p-valor do teste. Os passos são
muito parecidos aos já apresentados, a principal diferença está em não construir a região crítica. O
que se faz é indicar a probabilidade de ocorrer valores da estatística mais extremos do que o
observado, sob a hipótese de que H 0 ser verdadeira.

Você também pode gostar