Você está na página 1de 51

Métodos Estatísticos 1

Professor: Luís Gustavo Vinha (luisvinha@unb.br)

Departamento de Estatística – Prédio CIC/EST, sala A1-73/7


Passos para Construção de um Teste
de Hipóteses
Primeiro Passo: Fixe qual a hipótese nula, H0, a ser testada e qual a
hipótese alternativa (HA).

Segundo Passo: Use a teoria estatística e as informações disponíveis


para decidir qual estatística será usada para julgar a hipótese H0. Não
se esqueça de levantar as propriedades dessa estatística.
Passos para Construção de um Teste
de Hipóteses
Terceiro Passo: Fixe a probabilidade  de cometer um erro de primeira
espécie, e use este valor para construir a região crítica RC. Lembre que
esta região é construída para a estatística definida no segundo passo,
usando os valores hipotetizados por H0.

Quarto Passo: Use as informações fornecidas pela amostra para


encontrar o valor da estatística que definirá a decisão.
Passos para Construção de um Teste
de Hipóteses

Quinto Passo: Se o valor da estatística, observado na amostra, não


pertencer à região crítica, não rejeite H0; caso contrário, rejeite.

É importante, sempre que fizermos testes de hipóteses, distinguir


BEM estas cinco fases.
Procedimento Geral do
Teste de Hipóteses
Qualquer que seja a decisão tomada, estamos sujeitos a cometer
erros. Para facilitar a linguagem, necessitamos das seguintes
definições:

Erro do tipo I – rejeitar H0 quando esta é verdadeira.

Erro do tipo II – não rejeitar H0 quando esta é falsa.


Teste de Hipóteses

Não rejeitar H0
Poder de um Teste
Vimos que, na construção do teste de hipóteses, procuramos
controlar o erro do tipo I, fixando a sua probabilidade de ocorrência .
Fixado esse número, a região de rejeição RC é construída de modo que

P(θ̂  RC | H0 é verdadeira ) = 

Ou seja, admitindo que H0 seja verdadeira, estamos admitindo


conhecido(s) o(s) parâmetro(s) que define(m) a distribuição da
estatística usada no teste.
Poder de um Teste
Já, a probabilidade do erro do tipo II, na maioria dos casos, não é
possível calcular, pois a hipótese alternativa usualmente não especifica
uma única possibilidade, mas uma família de possibilidades alternativas.
Assim, definida uma hipótese H0 sobre um parâmetro  = 0, e
determinada uma região crítica RC para sua estatística ̂ , chamaremos de
função poder do teste a função

() = 1 − () = P(ˆ  RC | H0 é falsa)


Teste de Hipóteses

As latas de certa marca de cerveja comercializadas no mercado têm em


seu rótulo o volume de 350 mL. Os consumidores desse produto não
gostariam que a lata contivesse menos que o anunciado pelo fabricante.
Sabe-se que o desvio padrão do conteúdo das latas é igual a 10,5 mL, de
acordo com fabricante.

9
Teste de Hipóteses

Para averiguar a afirmação do fabricante, um instituto de direito do


consumidor decide coletar uma amostra de 36 latas da cerveja em
alguns pontos de comercialização e medir o conteúdo destas latas. Os
resultados obtidos na amostra foram:

Média amostral do conteúdo: x = 347 mL

10
Teste de Hipóteses

O resultado amostral indica que o volume médio de líquido


de todas as latas é menor do que o anunciado? OU O resultado
amostral poderia ser decorrência de mero acaso?
Será que as latas contêm 350 mL de líquido com 95% de
confiança?
 Qual a probabilidade do fabricante estar correto,
considerando os dados amostrais obtidos na pesquisa?

11
Teste de Hipóteses
No caso, o instituto de pesquisa escolhe, como hipótese inicial, que as latas de
refrigerante contêm em média 350 mL. A hipótese complementar é que as latas
contêm em média menos de 350 mL (seria uma lesão ao consumidor).
Escrevendo as hipóteses

H 0 :  = 350 mL
H a :   350 mL

Note que as hipóteses são formuladas em termos do parâmetro da população. Isso


ocorre porque há interesse em avaliar todo o processo de enchimento das latas, isto é, a
população de todas as latas de refrigerante da marca avaliada.
12
Teste de Hipóteses
A hipótese que contém a igualdade (H0) é chamada de hipótese nula e a
estatística do teste de hipóteses é baseada nela. A outra hipótese é
chamada alternativa (Ha).
Perceba que as 2 hipóteses são excludentes. Elas também podem ser
escritas da seguinte forma:

H 0 :   350 mL A afirmação do fabricante procede

H a :   350 mL A afirmação do fabricante não procede


As latas contêm em média menos de 350 mL

13
Teste de Hipóteses

Regra de Decisão e Erros no Teste de Hipóteses:


Ao utilizarmos uma estatística da amostra para tomar decisões sobre
um parâmetro da população, existe um risco de se chegar a uma
conclusão incorreta.
Realidade Conclusão do teste (amostra)
(população) H0 verdadeira H0 falsa
H0 verdadeira: Acerto Erro tipo I
Fabricante correto (confiança) ()
H0 falsa: Erro tipo II
Acerto
Fabricante errado ()
14
Teste de Hipóteses
Em palavras (no exemplo):
✓Rejeitar a Hipótese Nula :
Os resultados estatísticos indicam que as latas não estão de acordo com as
especificações do fabricante (contêm menos líquido que o indicado no rótulo)

✓Não Rejeitar a Hipótese Nula :


Não existe nenhuma evidência estatística que comprove que as latas não estão de
acordo com as especificações do fabricante (contêm menos líquido que o
indicado no rótulo)

15
Teste de Hipóteses
 ERRO TIPO I: Probabilidade do erro cometido ao rejeitar a hipótese nula
quando a mesma é verdadeira
 ERRO TIPO I I: Probabilidade do erro cometido ao não rejeitar a hipótese
nula quando a mesma é falsa (hipótese alternativa verdadeira)

No exemplo:
ERRO TIPO I: Probabilidade do erro cometido ao concluir que as latas não estão
de acordo com as especificações do fabricante, quando na verdade elas estão de
acordo com as especificações.
ERRO TIPO I I: Probabilidade do erro cometido ao concluir que as latas estão de
acordo com as especificações do fabricante, quando na verdade elas não estão de
acordo com as especificações.
16
Teste de Hipóteses
❖Na prática, especifica-se a probabilidade máxima de se cometer o ERRO
TIPO I
❖Essa probabilidade é chamada nível de significância ()
❖Geralmente essa probabilidade varia de 1% a 10%
❖O complementar do nível de significância é o nível de confiança, ou seja, se o
nível de significância for 5%, a confiança é 95%.
❖A probabilidade de cometer o ERRO TIPO II é representada por 
❖Muitas vezes essa probabilidade não é possível de ser medida

17
Teste de Hipóteses
Testes bicaudais e unicaudais
A distribuição do erro tipo I depende das hipóteses formuladas (olhar para o sentido de
Ha):
✓ Bicaudal: H0:  = o /2 /2

Ha:   o
Rejeita-se H0 para valores pequenos ou grandes

✓ Monocaudal: H0 :  = o

Ha :  > o
Rejeita-se H0 para valores grandes

✓ Monocaudal: H0 :  = o

Ha :  < o
Rejeita-se H0 para valores pequenos 18
Estatística do Teste
Caso 1: (variância populacional conhecida)

H0 :  = 0
a) Teste unilateral à esquerda:
Ha :   0

x − 0
a.1) Estatística do teste: Zobs =

n

a.2) Regra de rejeição, ao nível  de significância

Rejeito H0 se zobs < - z


19
Estatística do Teste
Caso 1: (variância populacional conhecida)

H0 :  = 0
b) Teste unilateral à direita:
Ha :   0

x − 0
b.1) Estatística do teste: Zobs =

n

b.2) Regra de rejeição, ao nível  de significância

Rejeito H0 se zobs > z


20
Estatística do Teste
Caso 1: (variância populacional conhecida)

H0 :  = 0
c) Teste bilateral:
Ha :   0

x − 0
c.1) Estatística do teste: Zobs =

n

c.2) Regra de rejeição, ao nível  de significância

Rejeito H0 se |zobs| > z/2


21
Teste de Hipóteses
Com base nas hipóteses do exemplo, rejeita-se a hipótese nula para valores pequenos
das médias amostrais. Então, qual deve ser o valor de z para os 5% (nível de
significância) dos menores valores da média amostral?
H 0 :   350 mL
H a :   350 mL

Nível de significância Nível de confiança


5% 95%

zcrítico = −1,65 0 z
Região de rejeição de Ho ou Região de não rejeição de Ho
Região Crítica 22
Teste de Hipóteses
✓Se o valor da normal padrão dos dados amostrais for menor que -1,65, então rejeita-
se a hipótese nula (o produto não está de acordo com as especificações).
✓ Região crítica: zobs < -1,65

Esta região pode ser escrita em termos da média amostral X , bastando despadronizar
o valor de z crítico (sob H0):

X crítico −  0 X crítico − 350


Z crítico =  −1,65 =  X crítico = 347,11 mL
 10,5
n 36

✓Região crítica: Rejeita-se H0 se X < 347,11 mL 23


Teste de Hipóteses
Estatística do Teste (obtida da amostra)
A padronização dos dados amostrais é feita levando-se me conta o valor da
média sob a hipótese nula (H0), ou seja m0 = 350.
H 0 :   350 mL
H a :   350 mL

X − 0 amostra
347 − 350
zobservado = zobservado = = −1,71
 10,5
n
X = 347 mL 36
 = 10,5 mL
24
Teste de Hipóteses
Conclusão do Teste
Fazemos a comparação dos valores populacionais, sob H0, com os valores
amostrais:
Conclusão: Rejeitamos a hipótese
nula, isto é, existem evidências
Nível de significância estatísticas de que o conteúdo das latas
5% seja menor do que o especificado pelo
fabricante, ao nível de significância de
5% (ou com 95% de confiança).

0 z
zcrítico = - 1,65
zobservado = - 1,71
Região de rejeição de Ho Região de não rejeição de Ho
25
Nível Descritivo do Teste
Vamos considerar novamente o problema de testar
H0 :  = 0
Ha :   0

0: conhecido
: desconhecido

Sejam x1, x2, ..., xn os valores observados de X para uma amostra


aleatória de tamanho n.
É razoável rejeitar H0 se a média amostral for muito maior que 0.
26
Nível Descritivo do Teste
Vamos supor que para uma amostra particular seja observado o
valor da média amostral e que ele seja superior a 0.

Definição: Supor que H0 é verdadeira (isto é,  = 0). Qual é a


probabilidade de observar-se um valor tão extremo quanto a média
amostral? Em outras palavras, quanto vale

P( X  x |  = 0 ) = ?

Essa probabilidade é denominada nível descritivo e será denotada


por p-valor, p-value ou, simplesmente p.
27
Nível Descritivo do Teste
Se p-valor for “alto” significa que não é difícil ocorrer um valor tão extremo
quanto a média amostral observada quando  = 0. Logo, é razoável neste caso não
rejeitar H0.

Por outro lado, se p-valor for um valor “pequeno” significa que é pouco
provável ocorrer um valor tão extremo quanto a média amostral observada quando 
= 0. Logo, é razoável, neste caso, rejeitar H0.

Se for estabelecido como sendo  o risco máximo em rejeitar H0 quando H0 é


verdadeira então, com base no nível descritivo, deve-se rejeitar H0 se p-valor < .

28
Nível Descritivo do Teste
O p-valor pode ser interpretado como a probabilidade de erro cometido ao rejeitar a
hipótese nula, quando esta é verdadeira, baseando-se na amostra observada.
Desta maneira, se o p-value do teste for menor que o erro tipo I (a), devemos rejeitar
a hipótese nula, uma vez que estaríamos cometendo um erro menor do que o máximo
admitido no teste (a)

Se p-valor <  Rejeita-se a hipótese nula

Se p-valor > 
Não se rejeita a hipótese nula

29
Nível Descritivo do Teste
Nível Descritivo – (p-value)
• Obtido através da estatística do teste

zcrítico = - 1,65
zcalculado = - 1,71 a = 5% z
p - value = 0,0436 P( Z < -1,71) = 0,0436

30
Nível Descritivo do Teste
Regra de decisão com p-value

Conclusão: Rejeitamos a hipótese nula (pois p-value = 0,0436 < 0,05 =


a), isto é, existem evidências estatísticas de que o conteúdo das latas seja
menor do que o especificado pelo fabricante. O p-value é utilizado como
medida de quão distante a média amostral está da média populacional sob
H0 (m0), ou seja, quanto 347 (média amostral) está distante de 350 (m0).

31
Nível Descritivo do Teste
Caso Bilateral:

H0 :  = 0
Ha :   0

É razoável rejeitar H0 se a média amostral observada


for muito maior ou muito menor que 0.

Como calcular o p-valor neste caso?

32
Nível Descritivo do Teste
Verifique se a média amostral observada é superior
ou inferior a 0. Vamos supor que tenha sido superior,
então, calculamos

p´= P( X  x |  = 0 )

define-se o nível descritivo

p = 2p´

33
Teste de Hipóteses

As latas de certa marca de cerveja comercializadas no mercado têm em seu rótulo o


volume de 350 mL. Os consumidores desse produto não gostariam que a lata contivesse
menos que o anunciado pelo fabricante.
Para averiguar a afirmação do fabricante, um instituto de direito do consumidor decide
coletar uma amostra de 36 latas da cerveja em alguns pontos de comercialização e medir
o conteúdo destas latas. Os resultados obtidos na amostra foram:

Média amostral do conteúdo: x = 347 mL


Desvio padrão amostral: s = 10,5 mL
34
Teste de Hipóteses

No caso, o instituto de pesquisa escolhe, como hipótese inicial, que as latas de cerveja
contêm em média 350 mL. A hipótese complementar é que as latas contêm em média
menos de 350 mL (seria uma lesão ao consumidor).
Escrevendo as hipóteses

H 0 :  = 350 mL
H a :   350 mL
Note que as hipóteses são formuladas em termos do parâmetro da população. Isso
ocorre porque há interesse em avaliar todo o processo de enchimento das latas, isto é, a
população de todas as latas de refrigerante da marca avaliada.
35
Estatística do Teste
Caso 2: (variância populacional desconhecida)

H0 :  = 0
a) Teste unilateral à esquerda:
Ha :   0

x − 0
a.1) Estatística do teste: t obs =
s
n

a.2) Regra de rejeição, ao nível  de significância

Rejeito H0 se t obs  −t(n−)1


36
Estatística do Teste
Caso 2: (variância populacional desconhecida)

H0 :  = 0
b) Teste unilateral à direita:
Ha :   0

x − 0
b.1) Estatística do teste: t obs =
s
n

b.2) Regra de rejeição, ao nível  de significância

Rejeito H0 se t obs  t(n−)1


37
Estatística do Teste
Caso 2: (variância populacional desconhecida)

H0 :  = 0
c) Teste bilateral:
Ha :   0

x − 0
c.1) Estatística do teste: t obs =
s
n

c.2) Regra de rejeição, ao nível  de significância

Rejeito H0 se | t obs |  t(n−1/ 2)


38
Teste de Hipóteses
✓Sabe-se que a distribuição da média amostral é t-Student quando a variância
populacional (s2) é desconhecida
✓Sob a hipótese nula, qual deve ser o valor de t para os 5% (nível de significância)
dos menores valores da média?
H 0 :  = 350 mL
H a :   350 mL
Nível de confiança
Nível de significância
95%
5%

t crítico = −1,69
0 t
Região de rejeição de Ho Região de não rejeição de Ho
Região Crítica 39
Teste de Hipóteses
Estatística do Teste (obtida da amostra)
A padronização dos dados amostrais é feita levando-se me conta o valor da média sob
a hipótese nula (H0), ou seja m0=350.

H 0 :   350 mL
H a :   350 mL

x - m0 amostra
= 347 - 350
t observado t observado = = - 1,71
s/ n 10,5/ 36
X = 347 mL
s = 10,5 mL
40
H 0 :  = 350 mL
Teste de Hipóteses
H a :   350 mL
Nível de confiança
Nível de significância
95%
5%

t crítico = −1,69
0 t
Região de rejeição de Ho Região de não rejeição de Ho

t observado = - 1,71
Conclusão: Rejeitamos a hipótese nula, isto é, existem evidências
estatísticas de que o conteúdo das latas seja menor do que o especificado
pelo fabricante, ao nível de significância de 5% (ou com 95% de
41
confiança).
Teste de Hipóteses
Desta maneira, o instituto de direito do consumidor entra em contato com o
fabricante da cerveja para explicar os resultados da pesquisa, dizendo que
entrará com uma ação na justiça em defesa dos consumidores.

Fizemos uma pesquisa e concluímos que


as latas de de cerveja da marca
comercializada têm em média menos de
350 mL de líquido com 95% de confiança.
Isso é um abuso!!!!!!! Os consumidores
estão sendo lesados e vamos entrar na
justiça.
42
Teste de Hipóteses

Para se defender, o fabricante decide fazer um teste de hipóteses com a mesma


amostra utilizada pelo instutito de direito do consumidor. O fabricante deseja testar se o
conteúdo das latas é igual a 350 mL, como anunciado no rótulo. Este equivale a verificar
se a máquina de enchimento das latas está regulada para colocar 350 mL ou não.
O fabricante deseja ter 95% de confiança de que as latas contêm em média 350
mL, assim, o nível de significância continua sendo 5% (a=5%). E este é o valor do erro
de dizer que as latas estão fora das especificações do fabricante, quando na realidade elas
estão dentro das especificações.

43
Teste de Hipóteses
O fabricante realiza o teste com base nas hipóteses
H 0 :  = 350 mL
H a :   350 mL
Qual a diferença entre o teste de hipóteses feito pelo fabricante e feito pelo instituto de
direito do consumidor?????????

A diferença está nas hipóteses e como o erro estará distribuído na curva da normal. O
importante para o fabricante é saber se as latas contêm exatamente o valor anunciado,
rejeitando a hipótese do produto estar dentro das especificações se as latas contiverem
valores muito inferiores (corresponde a prejuízo para os consumidores) ou muito superiores
(corresponde a prejuízo para o fabricante) ao anunciado no rótulo. O instituto só se importa
em saber se o conteúdo das latas é inferior ao valor anunciado pelo fabricante, gerando
prejuízo para os consumidores.
44
Teste de Hipóteses
Com base nas hipóteses do fabricante, rejeita-se a hipótese nula para valores pequenos ou
grandes das médias amostrais, então qual deve ser o valor de z para os 2,5% dos menores ou
maiores valores da média amostral?
H 0 :  = 350 mL
Nível de confiança 95%
H a :   350 mL
/2 = 2,5% /2 = 2,5%

0 t
t crítico = - 2,03 t crítico = 2,03

Região de rejeição de Ho Região de rejeição de Ho

Região de não
rejeição de Ho 45
Teste de Hipóteses
Região crítica: se o valor da estatística t observada for for menor que -2,03 ou maior de
2,03, então rejeita-se a hipótese nula (o produto não está de acordo com as especificações) –
note que o erro foi distribuído igualmente nas 2 caudas da distribuição normal.

Estatística do Teste (obtida da amostra)


Como os dados utilizados pelo fabricante são os mesmos que os usados pelo instituto, a
padronização dos dados amostrais continua tendo o mesmo valor sob a hipótese nula (H0),
ou seja m0 = 350.
x − 0 amostra
347 − 350
t observado = t observado = = −1,71
s/ n X = 347 mL 10,5/ 36
s = 10,5 mL
Os valores amostrais permanecem iguais, apenas alteramos a distribuição do erro do tipo I
(a=5%), segundo as hipóteses formuladas.
46
Teste de Hipóteses
Nível de confiança 95%

/2 = 2,5% /2 = 2,5%

0 t
t crítico = - 2,03 t crítico = 2,03
t observado= - 1,71
Região de rejeição de Ho Região de rejeição de Ho

Região de não
rejeição de Ho

Conclusão: Não rejeitamos a hipótese nula, isto é, existem


evidências estatísticas de que o conteúdo das latas não esteja fora das
especificações do fabricante, ao nível de significância de 5% (ou com
47
95% de confiança).
Teste de Hipóteses
Para calcular o p -value para testes bi-caudais devemos multiplicar por 2 o valor da
probabilidade calculada com a estatística do teste, já que rejeitamos a hipótese nula
tanto para pequenos como para grandes valores amostrais.
Dessa forma:
t observado= - 1,71
p - value = 2 ×0,048 = 0,096
Portanto, Não rejeitamos a hipótese nula (pois p-value = 0,0872 > 0,05 = a), isto é,
existem evidências estatísticas de que o conteúdo das latas não esteja fora das
especificações do fabricante.
Perceba que mesmo não rejeitando H0, sabendo o p-value do teste tenho idéia que a
distância entre as médias amostral e populacional não é muito grande, dado que p-value
= 0,0872 e a = 0,05.
48
Teste de Hipóteses
Desta maneira, o fabricante entra em contato com o instituto de direitos do
consumidor para explicar que refez a pesquisa utilizando os mesmos dados coletados
pelo instituto, dizendo que entrará com uma ação na justiça por difamação.

Usamos os mesmos dados e concluímos que


as latas de cerveja fabricadas por nossa
empresa contêm em média 350 mL de
líquido com 95% de confiança. O processo
está sob controle, mantendo o volume médio
de líquido correto nos recipientes.

49
Tamanho de Amostra Sugerido em Testes de
Hipóteses Unilaterais para a Média
Populacional

( z + z  ) 2   2
n=
( 0 −  a )2
em que:
z - valor z proveniente de uma área  numa distribuição
normal padrão;
z - valor z proveniente de uma área  numa distribuição
normal padrão;
50
Tamanho de Amostra Sugerido em Testes de
Hipóteses Unilaterais para a Média
Populacional
- desvio padrão populacional;
0 – média populacional sob H0;
A – média populacional sob Ha;

OBS:
Num teste de hipóteses bilateral utilizo z/2 no
lugar de z.

51

Você também pode gostar